文章链接快速总结技能
触发条件
当用户发送文章/新闻链接时,自动加载本技能进行总结。
支持的来源
- 微信公众号文章(mp.weixin.qq.com)
- 今日头条文章(m.toutiao.com, www.toutiao.com)
- 其他新闻/文章页面(根据具体页面结构选择提取方式)
执行步骤
1. 获取文章内容
- 用 curl 加上移动端 User-Agent 抓取文章页面(模拟 Android Chrome)
- 常用 UA:
Mozilla/5.0 (Linux; Android 13; Pixel 7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Mobile Safari/537.36 - 如有需要,添加
X-Requested-With: XMLHttpRequest头绕过部分防护 - 从返回的 HTML 中提取:
og:title/msg_title/title→ 文章标题descriptionmeta → 文章简介- 正文内容区(根据平台不同选择不同策略)
2. 正文提取策略
微信公众号(mp.weixin.qq.com)
- 正文:
id="js_content"或class="rich_media_content" - 如遇验证码,尝试切换 UA 为手机微信浏览器
- 至少可从
og:title和og:description拿到标题和摘要
今日头条(m.toutiao.com)
- HTML 中
articleInfo.content字段(URL编码的JSON)包含完整正文 - 渲染后的
<article>标签内也有纯文本 - 注意过滤掉下载App引导等无关内容
其他来源
- 通用策略:提取
<article>标签、或id="content"/class="content"等常见容器 - 优先级:结构化数据(JSON-LD)> meta 标签 > 页面正文容器
3. 正文清洗
- 去除 HTML 标签,保留段落结构
- 解码 HTML 实体
- 过滤无关内容(引导下载App、广告、推荐列表等)
4. 生成总结
- 字数严格限制在 300 字以内(中文)
- 用 简短、口语化的中文 表述
- 结构:一句话定性 → 2-3 个关键信息点 → 一句总结/观点
- 优先提取:文章核心论点、新鲜信息、对比数据、时间线、关键结论
- 纯文字段落形式,不要表格或列表标记
5. 输出
直接以文字段落形式回复,不要额外说明或询问是否需要更多细节。
注意事项
- 不同平台反爬策略不同,微信最严(可能弹验证码),头条较松
- 若多次尝试仍拿不到内容,如实告知用户,不要编造
- 如果文章已在记忆/会话中出现过,直接回复已有总结,不重复抓取
- 300 字以内是严格硬限制,超了需要精简
示例输出格式
标题:xxx xxx发布...(核心论点)。亮点在于...(关键信息)。另外...(对比/数据)。总的来说...(总结)。
微信扫一扫