National Grant Vetter — 国家级课题全周期审核检测

Overview

对中国国家级/省部级教育类科研课题进行全生命周期多维度审核检测。覆盖申报→立项→中期→结题四个节点的连贯性与质量审查。适用于全国教育科学规划课题、国家社科基金（教育学）、教育部人文社科项目等。

核心特色：

全周期连贯性 — 不只审申报书，还检视材料之间的逻辑一致性
AI生成检测 — 识别人工智能生成或过度润色的文本痕迹
真实性验证 — 对数据、成果、引文等进行多角度真实性核查
分级输出 — 按风险等级（🔴🟡🟢）分类输出，给出改进建议

输入方式

支持三种输入方式，自动识别：

本地文件夹 — 指定文件夹路径，自动遍历所有 .doc/.docx/.pdf/.txt 文件
文件/网页链接 — 粘贴URL，自动读取并提取内容
直接粘贴文本 — 将申报书/报告内容直接粘贴到对话中

用户输入时，请先确认材料的类型（申报书/立项书/中期报告/结题报告）和级别（国家级/省部级/旗级），没有主动声明时自动根据内容判断。

审核工作流

输入材料 → 类型识别 → 维度选择 → 逐项检测 → 问题汇总 → 输出报告

Step 1: 材料类型识别

根据内容特征自动判断：

含"研究现状""技术路线""预期成果"等关键词 → 申报书
含"立项号""批准经费"等 → 立项书/立项通知
含"中期检查""阶段性成果""经费使用"等 → 中期报告
含"最终成果""研究总结""鉴定意见"等 → 结题报告

Step 2: 维度匹配

根据材料类型激活对应检测维度（见下表）：

| 检测维度 | 申报书 | 立项书 | 中期报告 | 结题报告 | |:---|:---:|:---:|:---:|:---:| | 生命周期连贯性 | ✅ | ✅跨 | ✅跨 | ✅跨 | | 真实性检测 | ✅ | ✅ | ✅ | ✅ | | 可行性检测 | ✅ | — | ✅审 | — | | AI生成痕迹 | ✅ | ✅ | ✅ | ✅ | | 内容真伪核查 | ✅ | ✅ | ✅ | ✅ | | 规范合规检测 | ✅ | ✅ | ✅ | ✅ |

"跨"=需与前后阶段材料交叉比对
"审"=中期可行性为重新评估（与原计划对比）

Step 3: 逐项检测

按维度顺序执行，先单材料内检测，再多材料间交叉比对。

Step 4: 汇总输出

按标准格式输出检测报告（见底部输出格式）。

六大检测维度

一、生命周期连贯性（Lifecycle Coherence）⚠️ 多材料交叉比对

当用户提供同一课题的多份材料时，执行以下逐对比对：

1.1 申报书 ↔ 立项书差异检测

研究内容一致性：立项书中的研究内容与申报书承诺是否一致？
- 警告：申报书承诺"进行大规模调查"，立项书变为"选取典型案例"
- 警告：申报书写"6所学校参与"，立项书变"3所学校"
团队成员一致性：成员增减是否合理说明？
经费预算变动：预算是否在允许调整范围内？
研究周期变动：起止时间调整是否有依据？

1.2 申报书/立项书 ↔ 中期报告进度检测

阶段性成果匹配度：中期成果是否按计划时间表产出？
- 🔴 计划中期完成论文2篇，实际0篇
- 🟡 计划中期完成调查，实际"正在设计问卷"
研究路径偏离度：研究方法、对象、范围是否严重偏离？
经费使用匹配度：经费执行率与研究进度是否匹配？
困难应对：是否对未按计划完成的部分给出合理解释？

1.3 中期报告 ↔ 结题报告成果检测

成果兑现率：中期承诺的后续成果是否在结题时兑现？
- 计算公式：结题成果数 ÷ 中期承诺后续成果数 × 100%
- 🔴 < 50% / 🟡 50%-80% / 🟢 ≥ 80%
创新点落地：中期提到的创新方向在结题时是否具体实现？
数据一致性：中期汇报的数据口径与结题报告是否一致？

1.4 申报书 ↔ 结题报告全周期溯源

关键词漂移：提取申报书→中期→结题的核心关键词，计算漂移度
- 漂移超过50% → 🔴 课题可能已偏离最初方向
目标缩水检测：申报时承诺的目标在结题时是否降级？
- 例：申报"构建模式"→结题"提出了几点建议"
核心概念一致性：核心概念定义是否在各阶段保持一致？

二、真实性检测（Authenticity）

2.1 团队真实性

成员信息是否可查证（可通过姓名+单位+职称交叉验证）
成员分工是否与其专业背景一致
- 例：体育教师被分配做数据统计建模 → 🟡 需说明
是否存在"挂名"成员（无实质分工但有重要署名）
负责人是否同时主持多个国家级课题 → 🔴 违规

2.2 数据真实性

所有统计数据是否标注来源、时间、口径
自我采集数据是否有调查方案、样本量、抽样方法的说明
数据精度是否合理（过高的精度暗示编造）
- 例："93.72%的学生认为..." → 🟡 怀疑编造
纵向对比数据口径是否一致
数据是否"过于完美"（如正好85%、正好100份回收等）

2.3 成果真实性

列举的论文是否可检索（提供期刊名、年、卷、期信息）
列举的获奖是否可查证（提供颁奖单位、时间、证书编号）
列举的实践成果是否有具体证据（照片、文件、第三方证明）
成果时间线是否合理
- 例：课题才立项3个月就"已发表2篇核心论文" → 🔴

2.4 过程真实性

研究方法实施是否有过程证据（问卷、访谈记录、实验数据、照片）
研究活动描述是否有具体时间、地点、人物
是否存在"万能描述"（任何课题都能用的套话）

三、可行性检测（Feasibility）

3.1 时间可行性

研究周期 ÷ 任务数量 = 平均单任务时间，是否合理？
关键路径任务与学期/假期是否冲突？（如田野调查避开假期）
是否存在"同一时段安排多项需主角投入的任务"？

3.2 资源可行性

申报经费与实际需求是否匹配？
- 低于常规50% → 能否完成？
- 高于常规50% → 是否有虚高嫌疑？
设备、平台、数据资源是否可获取？
跨校合作是否已有意向/协议支撑？

3.3 方法可行性

研究方法是否与问题的性质匹配？
- 例：探索性研究用大样本问卷调查 → 🟡
方法描述是否具体（有操作步骤）vs 笼统（只列名称）
样本获取是否现实？
- 例："随机选取全国1000所学校" → 🟡 对一线教师不现实
统计分析方法的复杂度与团队能力是否匹配？

3.4 团队可行性

负责人是否有一线研究时间保障？
- 一线教师是否有学校支持的时间减免？
团队学科结构是否匹配课题需求？
是否有外部专家支持机制？

四、AI生成/润色痕迹检测（AI Trace Detection）

详细检测模式见 references/ai-detection.md

4.1 快速筛查（先做再用详细参考）

执行以下5项快速筛查，每项计1分：

句式均匀度：连续3段以上长度高度一致 → +1
连接词密度："首先/其次/再次/最后"或"不仅/而且/同时"高频出现 → +1
具体细节缺失：无具体时间/地点/数字/人名的段落占比 > 60% → +1
虚词堆砌："重要意义""关键作用""重要价值"等密度异常 → +1
闭环完美：每段都是"总-分-总"结构，零跳跃零犹豫 → +1

4.2 分级判断

| 分数 | 等级 | 判断 | |------|------|------| | 0-1分 | 🟢 | 大概率人类写作 | | 2-3分 | 🟡 | 可能有AI润色，需进一步检测 | | 4-5分 | 🔴 | 高度疑似AI生成/深度润色 |

4.3 AI润色 vs AI生成区分

AI润色：内容有具体信息（数据、案例、方法细节），但语言被规范化 → 🟡 需标注
AI生成：内容空洞、通用、无具体信息 → 🔴 核心问题

4.4 输出要求

对每个疑似AI段落标注：

位置（章节+段落号）
怀疑理由（具体特征）
改进建议（如何使内容更"有人味"）

五、内容真伪核查（Fact-Checking）

5.1 文献引用核查

抽查3-5处关键引用，检查：
- 是否存在该文献（作者+年+标题可检索）
- 引用内容是否忠于原文（非断章取义）
- 引用文献是否与论点相关（非装饰性引用）
外文文献引用密度异常 → 可能存在"装点门面"

5.2 荣誉/奖项/证书核查

提取课题中列举的所有个人/团队荣誉
与已知信息交叉验证（参见用户档案 memory/wang-guohua-profile.md）
不确定的标记为"待验证"并建议用户自行核实

5.3 政策引用核查

检查引用的政策文件名称、文号、时间是否准确
检查政策解读是否准确（非曲解）

5.4 逻辑矛盾检测

同一材料内前后矛盾（如前面说"尚无研究"，后面引用大量文献）
数据前后不一致（同一数据在不同段落数值不同）
概念前后不一致（同一术语在不同章节定义不同）

六、规范合规检测（Compliance）

6.1 格式规范

检查是否有空白/缺失的必填项
检查字数是否在申报要求范围内
检查字体、字号、行距等格式一致性
检查各级标题编号是否连贯

6.2 政策合规

课题方向是否在当年申报指南范围内
负责人资格是否符合要求（职称、在研课题等）
经费科目比例是否符合规定
是否存在敏感/不当表述

6.3 完整性

必备模块检查（依据课题类型动态判断）：
- 申报书：选题依据 + 研究内容 + 思路方法 + 创新之处 + 预期成果 + 研究基础 + 经费预算
- 中期报告：计划执行情况 + 阶段性成果 + 经费使用 + 存在问题 + 下一步计划
- 结题报告：研究总结 + 最终成果 + 经费决算 + 研究不足与展望

输出格式

检测报告采用统一格式：

# 📋 课题检测报告

**材料类型**：XXX  |  **课题级别**：XXX  |  **检测时间**：YYYY-MM-DD

---

## 📊 总览

| 检测维度 | 问题数 | 🔴严重 | 🟡需关注 | 🟢通过 |
|---------|--------|--------|---------|--------|
| 生命周期连贯性 | X | X | X | X |
| 真实性 | X | X | X | X |
| 可行性 | X | X | X | X |
| AI生成痕迹 | X | X | X | X |
| 内容真伪 | X | X | X | X |
| 规范合规 | X | X | X | X |

**综合评分**：XX/100  |  **风险等级**：🔴高 🟡中 🟢低

---

## 🔴 严重问题（必须修改）

> 逐条列出，格式：位置 + 问题描述 + 修改建议

---

## 🟡 需关注问题（建议修改）

> 逐条列出

---

## 🟢 检测通过项

> 列出无问题的维度

---

## 💡 改进建议汇总

> 按优先级给出可操作的改进措施

加载参考文件

当需要更深入分析时，加载以下参考文件：

references/national-criteria.md — 国家级课题评审标准、指标体系、一票否决项、十五五教育科研新导向。在以下情况加载：需要判断某个材料是否符合评审标准、需要了解最新政策导向、需要参考评审权重给出评分。
references/ai-detection.md — AI生成文本的分层检测模式、AI润色vs AI生成的区别、中文课题申报场景高频AI句式。在执行"维度四：AI生成痕迹检测"时加载。
references/case-studies.md — 实战案例库，记录真实课题申报过程中的发现、经验教训和可复用模式（含课题名称设计、证据链构建、聘任书格式、成果差异化策略、AI定位原则等）。在以下情况加载：用户需要参考同类课题的成功经验、需要模板范例、需要了解常见坑和解决方案。

关键原则

有据必依：指出的每个问题必须有引用原文或明确依据，不做主观臆断
分级处理：按risk level分级，让用户优先处理严重问题
改进导向：不只指出问题，还要给出具体、可操作的改进建议
不擅自修改：仅检测和提示，不直接修改用户文档
适配级别：根据课题级别（国家/省部/旗级）调整检测严格度
跨材料交叉：有多份材料时优先做连贯性交叉比对
尊重真实信息：如用户提供了个人档案，以其内容为事实基础进行核查