城市舆情监测分析系统 (City Public Opinion Monitor)

技能概述

城市舆情监测分析系统是一套面向城市管理部门、政府机构及公共事务研究者的智能舆情分析工具。系统通过对新闻媒体、社交媒体、网络论坛、政府公告等多源数据的自动化采集与分析，实现从舆情发现到决策支持的完整闭环。

适用场景：城市管理舆情监测、突发事件舆论追踪、政策发布民意反馈、重大活动舆情保障、行业舆情趋势研判。

触发词

当用户输入包含以下关键词或场景描述时，应激活本技能：

中文触发词：舆情监测 舆情分析 舆情报告 舆情预警 城市舆情 舆论分析 热点追踪 舆情研判 民意分析 舆论监测 舆情洞察 舆情态势
英文触发词：public opinion sentiment monitoring opinion analysis opinion mining public sentiment
场景描述：帮我监测一下...的舆论情况 分析...的网络舆情 生成一份舆情报告 最近...的舆论风向怎么样 预警...的舆情风险

不触发条件

以下场景不触发本技能（即使包含关键词）：

个人品牌/艺人舆情监控（属娱乐营销领域）
竞品负面挖掘（属商业情报领域）
要求删帖/控评操作（违反合规要求）
纯技术性的NLP模型训练需求

六步工作流程

第一步：数据采集 (Data Collection)

目标：从多源渠道全面采集目标主题相关的舆情数据。

采集渠道： | 渠道 | 说明 | 采集方式 | |------|------|----------| | 新闻媒体 | 主流新闻网站、地方媒体 | API/爬虫 | | 社交媒体 | 微博、微信公众号、抖音等 | API/公开数据 | | 网络论坛 | 知乎、贴吧、地方论坛 | 爬虫/搜索 | | 政府公告 | 政府网站、政务新媒体 | API/定期抓取 |

采集参数：

时间范围（默认近7天）
关键词组合（支持AND/OR/NOT逻辑）
地域筛选（省/市/区县级）
数据量上限（默认5000条）

第二步：情感分析 (Sentiment Analysis)

目标：对采集到的文本进行情感倾向判定，识别公众情绪分布。

情感分类体系：

正面 (Positive)：支持、赞扬、期待、满意
中性 (Neutral)：客观陈述、事实播报、提问
负面 (Negative)：批评、不满、担忧、愤怒
敏感 (Sensitive)：涉及谣言、煽动、极端言论

可审计性要求：

每条情感标签必须附带判定依据（关键词匹配或模型输出的置信度分数）
支持人工抽检复验，情感标签与原文可追溯对照

第三步：主题聚类 (Topic Clustering)

目标：从海量文本中自动提取讨论热点和子议题。

聚类方法：

关键词提取（TF-IDF + TextRank）
LDA主题模型
共现网络分析
时间序列聚类（发现议题演化阶段）

输出：

主题词云（Top 20关键词）
议题分布饼图
议题热度时间线

第四步：风险识别 (Risk Identification)

目标：基于多维度指标量化评估舆情风险等级。

5级风险等级体系： | 等级 | 名称 | 定义 | 响应建议 | |------|------|------|----------| | 1级 | 极低风险 | 少量讨论，无负面情绪 | 常规监测 | | 2级 | 低风险 | 局部讨论，负面占比<20% | 关注跟踪 | | 3级 | 中风险 | 较多讨论，负面占比20-50% | 分析研判 | | 4级 | 高风险 | 广泛传播，负面占比>50% | 启动预案 | | 5级 | 极高风险 | 重大舆情事件，跨平台传播 | 紧急响应 |

风险评分维度（权重可配）：

传播热度指数（25%）：发文量、阅读量、转发量
负面情绪占比（30%）：负面+敏感内容比例
传播加速度（20%）：单位时间增量变化率
意见领袖参与度（15%）：大V/权威账号参与情况
跨平台扩散度（10%）：是否跨平台传播

第五步：趋势预测 (Trend Prediction)

目标：基于历史数据和当前态势，预测舆情未来走势。

预测维度：

热度趋势（上升/平稳/下降/反复）
情感演化（情绪极化/缓解/反转）
议题分化（话题裂变/合并/消退）
关键时间节点（预测可能的爆发点）

方法论：

基于SIR传播模型的热度预测
基于情感曲线的情感演变分析
结合外部事件日历的触发预测

第六步：报告生成 (Report Generation)

目标：生成结构化的舆情监测报告。

报告类型：

日报：概要式，关键指标+异常预警
周报：趋势分析+热点盘点
专报：特定事件深度分析
月报/季报：宏观态势+决策建议

报告核心要素（必须包含）：

监测概览（时间、范围、数据量）
情感分析结果（分布及变化）
热点话题TOP10
风险等级评估
趋势预测与建议
数据来源列表及引用标注

约束规则 (MUST FOLLOW)

来源引用：报告中所有数据和分析结论必须标明数据来源，不可引用来源的推测性内容需标注"分析研判"
情感标注可审计：每条情感标签必须可追溯到原始文本，支持抽查验证
风险量化：风险等级必须基于5级量化体系判定，不可仅凭主观判断
时效标注：所有数据必须标注采集时间，报告需注明生成时间戳
免责声明：报告生成后自动附带"本报告由AI辅助生成，仅供参考"声明

错误处理与边界情况

空数据（0条舆情）：报告输出"监测周期内未捕获到相关舆情数据"，不强制生成分析章节
单条数据（1条）：跳过情感分布统计和趋势预测章节，仅做单条内容摘要
数据格式错误：scripts/opinion-analyzer.py 自动检测并报告格式问题，提示修正后重新运行
API调用失败：指数退避重试（最多3次，间隔5s/10s/20s），3次失败后使用缓存数据并标注
全正面/全负面数据：报告中注明"样本极性单一，统计指标参考价值有限"

可扩展性与配置化

情感分析引擎支持可插拔策略：默认使用词典匹配（assets/config.json 中 sentiment.method: "lexicon"），可切换为 "ml" 或 "llm" 模式
数据采集器通过统一接口管理：scripts/collectors/ 目录实现 CollectorInterface 三个方法（search/parse/normalize），新增数据源只需实现该接口
告警规则可自定义：由 config.json 的 alerts.rules 数组驱动，支持自定义阈值和告警渠道

输出交付物

执行完成后，用户获得：

结构化舆情监测报告（Markdown/HTML格式）
情感分析数据明细（CSV格式，含原文-标签对照）
风险预警简报（如有异常）
数据来源清单

测试

运行验证：bash scripts/validate.sh sample-output.md 确保10项检查通过
数据测试：使用 references/examples/sample-input.md 中的20条数据作为测试fixture
回归测试：修改 scripts/opinion-analyzer.py 后运行 python scripts/opinion-analyzer.py references/examples/sample-input.md --validate 验证分析精度
测试套件：完整 pytest 测试套件位于 scripts/tests/（含单元测试和集成测试）

版本信息

版本：v1.0.0
作者：AI Agent Skill Team
最后更新：2026-05-27
适用平台：WorkBuddy AI Agent