热点采集器 — 行业热点智能过滤
概述
基于hotspot-aggregator封装的热点采集器,新增行业关键词智能过滤、多平台聚合、相关度评分能力。为新媒体内容生产提供精准行业热点数据。
执行步骤
Step 1:读取行业配置
调用行业配置管理器,提取关键词监控字段。
Step 2:调用底层采集
调用hotspot-aggregator进行热点采集,覆盖:百度热搜、微博热搜、抖音热榜、知乎热榜。
Step 3:行业关键词过滤
将采集结果与行业关键词匹配:
- 精确匹配(权重3):关键词完整出现
- 模糊匹配(权重1):关键词部分出现
- 语义关联(权重2):行业相关概念
Step 4:相关度评分排序
评分 = 精确匹配数×3 + 模糊匹配数×1 + 热度分×0.1
Step 5:输出热点清单
【今日热点】2026-05-10 | OPC一人公司孵化
1. 一人公司如何用AI降本增效 | 热度9856 | 相关度9.2
2. 2026副业风口盘点 | 热度8734 | 相关度8.5
...
约束与边界
- 必须先加载行业配置
- 关键词至少3个,最多20个
- 仅采集近24小时热点
- Top 10中至少3条高相关度(≥7分)
异常处理
| 场景 | 处理 | |------|------| | 行业配置未加载 | 提示"请先加载行业配置" | | hotspot-aggregator调用失败 | 用web_fetch抓取百度热搜兜底 | | 无相关热点 | 输出通用行业热点,标注"相关度较低" |
输入输出示例
输入:采集热点,行业:opc_incubator
输出:Top 10行业热点清单,含热度分和相关度评分。
微信扫一扫