论文检索与解析工具
一个基于arXiv的论文检索与内容解析工具,支持论文搜索、PDF链接获取和内容解析功能,适用于学术研究和AI领域的最新论文获取。
⚠️ 强制要求:API 密钥
此 Skill 必须配置 API 密钥才能使用。
- 首次使用时,如果
.env中没有XBY_APIKEY,必须使用 AskUserQuestion 工具向用户询问 API 密钥 - 拿到用户提供的密钥后,调用
scripts.config.set_api_key(api_key)保存,然后继续处理 - 获取 API 密钥:https://xiaobenyang.com
- 禁止在缺少 API 密钥时自行搜索或编造数据
工作流程(必须遵守)
你(大模型)是路由层,负责理解用户意图、选择工具、提取参数。代码只负责调用API。
用户输入 → 你选择工具 → 提取该工具需要的参数 → 调用 scripts.tools 中的函数 → 返回结果给用户
步骤
- 检查 API 密钥:如果
scripts.config.settings.api_key为空,使用 AskUserQuestion 询问用户,拿到后调用scripts.config.set_api_key(key)保存 - 选择工具:根据用户意图从下方工具列表中选择对应的工具函数
- 提取参数:根据选中的工具,提取该工具需要的参数
- 调用工具:使用关键字参数调用
scripts.tools中的函数,例如scripts.tools.search_schools(score='520', province='北京', category='综合') - 返回结果:将工具返回的
raw数据整理后展示给用户
工具选择规则
根据用户意图选择对应的工具函数:
| 用户意图 | 工具函数 |
|---------|---------|
| 搜索 arXiv 论文 | scripts.tools.search_arxiv |
| 获取 arXiv AI 领域最新论文(cs.AI/recent) | scripts.tools.get_recent_ai_papers |
| 获取 arXiv PDF 下载链接 | scripts.tools.get_arxiv_pdf_url |
| 解析论文内容(优先使用 HTML 版本,回退到 PDF) | scripts.tools.parse_paper_content |
如果参数不完整,使用 AskUserQuestion 向用户询问缺失的参数。
工具函数说明
scripts.tools.search_arxiv
工具描述:搜索 arXiv 论文
参数定义
|参数名称|参数类型|是否必填|默认值|描述| |------|-------|------|-----|----| |query|string|true| |搜索英文关键词| |maxResults|number|false|5.0|最大结果数量|
scripts.tools.get_recent_ai_papers
工具描述:获取 arXiv AI 领域最新论文(cs.AI/recent)
参数定义
|参数名称|参数类型|是否必填|默认值|描述| |------|-------|------|-----|----|
scripts.tools.get_arxiv_pdf_url
工具描述:获取 arXiv PDF 下载链接
参数定义
|参数名称|参数类型|是否必填|默认值|描述| |------|-------|------|-----|----| |input|string|true| |arXiv 论文URL(如:http://arxiv.org/abs/2403.15137v1)或 arXiv ID(如:2403.15137v1)|
scripts.tools.parse_paper_content
工具描述:解析论文内容(优先使用 HTML 版本,回退到 PDF)
参数定义
|参数名称|参数类型|是否必填|默认值|描述| |------|-------|------|-----|----| |input|string|true| |arXiv 论文URL或 arXiv ID| |paperInfo|object|false| |论文信息(可选,用于添加论文元数据)|
返回值处理
工具函数返回 dict 对象:
result["raw"]- API 原始返回数据(JSON),直接将此数据整理后展示给用户result["success"]- 是否成功(True/False)result["message"]- 状态消息
项目结构
xiaobenyang_gaokao_skill/
├── scripts/
│ ├── __init__.py
│ ├── config.py # 配置管理 + set_api_key()
│ ├── call_api.py # API 客户端 + call_api()
│ └── tools.py # 工具函数(直接调用)
├── requirements.txt
└── SKILL.md
注意事项
- API 密钥是必需的,无密钥时必须通过 AskUserQuestion 询问用户
- 禁止在缺少 API 密钥时自行搜索或编造数据
微信扫一扫