National Grant Vetter — 国家级课题全周期审核检测
Overview
对中国国家级/省部级教育类科研课题进行全生命周期多维度审核检测。覆盖申报→立项→中期→结题四个节点的连贯性与质量审查。适用于全国教育科学规划课题、国家社科基金(教育学)、教育部人文社科项目等。
核心特色:
- 全周期连贯性 — 不只审申报书,还检视材料之间的逻辑一致性
- AI生成检测 — 识别人工智能生成或过度润色的文本痕迹
- 真实性验证 — 对数据、成果、引文等进行多角度真实性核查
- 分级输出 — 按风险等级(🔴🟡🟢)分类输出,给出改进建议
输入方式
支持三种输入方式,自动识别:
- 本地文件夹 — 指定文件夹路径,自动遍历所有 .doc/.docx/.pdf/.txt 文件
- 文件/网页链接 — 粘贴URL,自动读取并提取内容
- 直接粘贴文本 — 将申报书/报告内容直接粘贴到对话中
用户输入时,请先确认材料的类型(申报书/立项书/中期报告/结题报告)和级别(国家级/省部级/旗级),没有主动声明时自动根据内容判断。
审核工作流
输入材料 → 类型识别 → 维度选择 → 逐项检测 → 问题汇总 → 输出报告
Step 1: 材料类型识别
根据内容特征自动判断:
- 含"研究现状""技术路线""预期成果"等关键词 → 申报书
- 含"立项号""批准经费"等 → 立项书/立项通知
- 含"中期检查""阶段性成果""经费使用"等 → 中期报告
- 含"最终成果""研究总结""鉴定意见"等 → 结题报告
Step 2: 维度匹配
根据材料类型激活对应检测维度(见下表):
| 检测维度 | 申报书 | 立项书 | 中期报告 | 结题报告 | |:---|:---:|:---:|:---:|:---:| | 生命周期连贯性 | ✅ | ✅跨 | ✅跨 | ✅跨 | | 真实性检测 | ✅ | ✅ | ✅ | ✅ | | 可行性检测 | ✅ | — | ✅审 | — | | AI生成痕迹 | ✅ | ✅ | ✅ | ✅ | | 内容真伪核查 | ✅ | ✅ | ✅ | ✅ | | 规范合规检测 | ✅ | ✅ | ✅ | ✅ |
- "跨"=需与前后阶段材料交叉比对
- "审"=中期可行性为重新评估(与原计划对比)
Step 3: 逐项检测
按维度顺序执行,先单材料内检测,再多材料间交叉比对。
Step 4: 汇总输出
按标准格式输出检测报告(见底部输出格式)。
六大检测维度
一、生命周期连贯性(Lifecycle Coherence)⚠️ 多材料交叉比对
当用户提供同一课题的多份材料时,执行以下逐对比对:
1.1 申报书 ↔ 立项书 差异检测
- 研究内容一致性:立项书中的研究内容与申报书承诺是否一致?
- 警告:申报书承诺"进行大规模调查",立项书变为"选取典型案例"
- 警告:申报书写"6所学校参与",立项书变"3所学校"
- 团队成员一致性:成员增减是否合理说明?
- 经费预算变动:预算是否在允许调整范围内?
- 研究周期变动:起止时间调整是否有依据?
1.2 申报书/立项书 ↔ 中期报告 进度检测
- 阶段性成果匹配度:中期成果是否按计划时间表产出?
- 🔴 计划中期完成论文2篇,实际0篇
- 🟡 计划中期完成调查,实际"正在设计问卷"
- 研究路径偏离度:研究方法、对象、范围是否严重偏离?
- 经费使用匹配度:经费执行率与研究进度是否匹配?
- 困难应对:是否对未按计划完成的部分给出合理解释?
1.3 中期报告 ↔ 结题报告 成果检测
- 成果兑现率:中期承诺的后续成果是否在结题时兑现?
- 计算公式:结题成果数 ÷ 中期承诺后续成果数 × 100%
- 🔴 < 50% / 🟡 50%-80% / 🟢 ≥ 80%
- 创新点落地:中期提到的创新方向在结题时是否具体实现?
- 数据一致性:中期汇报的数据口径与结题报告是否一致?
1.4 申报书 ↔ 结题报告 全周期溯源
- 关键词漂移:提取申报书→中期→结题的核心关键词,计算漂移度
- 漂移超过50% → 🔴 课题可能已偏离最初方向
- 目标缩水检测:申报时承诺的目标在结题时是否降级?
- 例:申报"构建模式"→结题"提出了几点建议"
- 核心概念一致性:核心概念定义是否在各阶段保持一致?
二、真实性检测(Authenticity)
2.1 团队真实性
- 成员信息是否可查证(可通过姓名+单位+职称交叉验证)
- 成员分工是否与其专业背景一致
- 例:体育教师被分配做数据统计建模 → 🟡 需说明
- 是否存在"挂名"成员(无实质分工但有重要署名)
- 负责人是否同时主持多个国家级课题 → 🔴 违规
2.2 数据真实性
- 所有统计数据是否标注来源、时间、口径
- 自我采集数据是否有调查方案、样本量、抽样方法的说明
- 数据精度是否合理(过高的精度暗示编造)
- 例:"93.72%的学生认为..." → 🟡 怀疑编造
- 纵向对比数据口径是否一致
- 数据是否"过于完美"(如正好85%、正好100份回收等)
2.3 成果真实性
- 列举的论文是否可检索(提供期刊名、年、卷、期信息)
- 列举的获奖是否可查证(提供颁奖单位、时间、证书编号)
- 列举的实践成果是否有具体证据(照片、文件、第三方证明)
- 成果时间线是否合理
- 例:课题才立项3个月就"已发表2篇核心论文" → 🔴
2.4 过程真实性
- 研究方法实施是否有过程证据(问卷、访谈记录、实验数据、照片)
- 研究活动描述是否有具体时间、地点、人物
- 是否存在"万能描述"(任何课题都能用的套话)
三、可行性检测(Feasibility)
3.1 时间可行性
- 研究周期 ÷ 任务数量 = 平均单任务时间,是否合理?
- 关键路径任务与学期/假期是否冲突?(如田野调查避开假期)
- 是否存在"同一时段安排多项需主角投入的任务"?
3.2 资源可行性
- 申报经费与实际需求是否匹配?
- 低于常规50% → 能否完成?
- 高于常规50% → 是否有虚高嫌疑?
- 设备、平台、数据资源是否可获取?
- 跨校合作是否已有意向/协议支撑?
3.3 方法可行性
- 研究方法是否与问题的性质匹配?
- 例:探索性研究用大样本问卷调查 → 🟡
- 方法描述是否具体(有操作步骤)vs 笼统(只列名称)
- 样本获取是否现实?
- 例:"随机选取全国1000所学校" → 🟡 对一线教师不现实
- 统计分析方法的复杂度与团队能力是否匹配?
3.4 团队可行性
- 负责人是否有一线研究时间保障?
- 一线教师是否有学校支持的时间减免?
- 团队学科结构是否匹配课题需求?
- 是否有外部专家支持机制?
四、AI生成/润色痕迹检测(AI Trace Detection)
详细检测模式见
references/ai-detection.md
4.1 快速筛查(先做再用详细参考)
执行以下5项快速筛查,每项计1分:
- 句式均匀度:连续3段以上长度高度一致 → +1
- 连接词密度:"首先/其次/再次/最后"或"不仅/而且/同时"高频出现 → +1
- 具体细节缺失:无具体时间/地点/数字/人名的段落占比 > 60% → +1
- 虚词堆砌:"重要意义""关键作用""重要价值"等密度异常 → +1
- 闭环完美:每段都是"总-分-总"结构,零跳跃零犹豫 → +1
4.2 分级判断
| 分数 | 等级 | 判断 | |------|------|------| | 0-1分 | 🟢 | 大概率人类写作 | | 2-3分 | 🟡 | 可能有AI润色,需进一步检测 | | 4-5分 | 🔴 | 高度疑似AI生成/深度润色 |
4.3 AI润色 vs AI生成 区分
- AI润色:内容有具体信息(数据、案例、方法细节),但语言被规范化 → 🟡 需标注
- AI生成:内容空洞、通用、无具体信息 → 🔴 核心问题
4.4 输出要求
对每个疑似AI段落标注:
- 位置(章节+段落号)
- 怀疑理由(具体特征)
- 改进建议(如何使内容更"有人味")
五、内容真伪核查(Fact-Checking)
5.1 文献引用核查
- 抽查3-5处关键引用,检查:
- 是否存在该文献(作者+年+标题可检索)
- 引用内容是否忠于原文(非断章取义)
- 引用文献是否与论点相关(非装饰性引用)
- 外文文献引用密度异常 → 可能存在"装点门面"
5.2 荣誉/奖项/证书核查
- 提取课题中列举的所有个人/团队荣誉
- 与已知信息交叉验证(参见用户档案
memory/wang-guohua-profile.md) - 不确定的标记为"待验证"并建议用户自行核实
5.3 政策引用核查
- 检查引用的政策文件名称、文号、时间是否准确
- 检查政策解读是否准确(非曲解)
5.4 逻辑矛盾检测
- 同一材料内前后矛盾(如前面说"尚无研究",后面引用大量文献)
- 数据前后不一致(同一数据在不同段落数值不同)
- 概念前后不一致(同一术语在不同章节定义不同)
六、规范合规检测(Compliance)
6.1 格式规范
- 检查是否有空白/缺失的必填项
- 检查字数是否在申报要求范围内
- 检查字体、字号、行距等格式一致性
- 检查各级标题编号是否连贯
6.2 政策合规
- 课题方向是否在当年申报指南范围内
- 负责人资格是否符合要求(职称、在研课题等)
- 经费科目比例是否符合规定
- 是否存在敏感/不当表述
6.3 完整性
- 必备模块检查(依据课题类型动态判断):
- 申报书:选题依据 + 研究内容 + 思路方法 + 创新之处 + 预期成果 + 研究基础 + 经费预算
- 中期报告:计划执行情况 + 阶段性成果 + 经费使用 + 存在问题 + 下一步计划
- 结题报告:研究总结 + 最终成果 + 经费决算 + 研究不足与展望
输出格式
检测报告采用统一格式:
# 📋 课题检测报告
**材料类型**:XXX | **课题级别**:XXX | **检测时间**:YYYY-MM-DD
---
## 📊 总览
| 检测维度 | 问题数 | 🔴严重 | 🟡需关注 | 🟢通过 |
|---------|--------|--------|---------|--------|
| 生命周期连贯性 | X | X | X | X |
| 真实性 | X | X | X | X |
| 可行性 | X | X | X | X |
| AI生成痕迹 | X | X | X | X |
| 内容真伪 | X | X | X | X |
| 规范合规 | X | X | X | X |
**综合评分**:XX/100 | **风险等级**:🔴高 🟡中 🟢低
---
## 🔴 严重问题(必须修改)
> 逐条列出,格式:位置 + 问题描述 + 修改建议
---
## 🟡 需关注问题(建议修改)
> 逐条列出
---
## 🟢 检测通过项
> 列出无问题的维度
---
## 💡 改进建议汇总
> 按优先级给出可操作的改进措施
加载参考文件
当需要更深入分析时,加载以下参考文件:
references/national-criteria.md— 国家级课题评审标准、指标体系、一票否决项、十五五教育科研新导向。在以下情况加载:需要判断某个材料是否符合评审标准、需要了解最新政策导向、需要参考评审权重给出评分。references/ai-detection.md— AI生成文本的分层检测模式、AI润色vs AI生成的区别、中文课题申报场景高频AI句式。在执行"维度四:AI生成痕迹检测"时加载。references/case-studies.md— 实战案例库,记录真实课题申报过程中的发现、经验教训和可复用模式(含课题名称设计、证据链构建、聘任书格式、成果差异化策略、AI定位原则等)。在以下情况加载:用户需要参考同类课题的成功经验、需要模板范例、需要了解常见坑和解决方案。
关键原则
- 有据必依:指出的每个问题必须有引用原文或明确依据,不做主观臆断
- 分级处理:按risk level分级,让用户优先处理严重问题
- 改进导向:不只指出问题,还要给出具体、可操作的改进建议
- 不擅自修改:仅检测和提示,不直接修改用户文档
- 适配级别:根据课题级别(国家/省部/旗级)调整检测严格度
- 跨材料交叉:有多份材料时优先做连贯性交叉比对
- 尊重真实信息:如用户提供了个人档案,以其内容为事实基础进行核查
微信扫一扫