skill.md

name: academic-pipeline
description: 面向完整学术研究流程的编排器：研究 -> 写作 -> 完整性检查 -> 评审 -> 修订 -> 再评审 -> 再修订 -> 最终完整性检查 -> 定稿。将 deep-research、academic-paper 和 academic-paper-reviewer 协调成一个无缝的10阶段工作流，包含强制完整性验证、两阶段同行评审以及可重复的质量关卡。触发条件：学术流程、从研究到论文、完整论文工作流、论文流程、端到端论文、从研究到发表、完整的论文工作流。
metadata:
    version: "3.13.0"
    last_updated: "2026-06-18"
    depends_on: "deep-research, academic-paper, academic-paper-reviewer"
    status: active
    data_access_level: verified_only
    task_type: open-ended
    related_skills:
        - deep-research
        - academic-paper
        - academic-paper-reviewer

Academic Pipeline v3.13.0 — 全学术研究流程编排器

一个轻量级编排器，管理从研究探索到最终文稿的完整学术流程。它不执行实质性工作——仅检测阶段、推荐模式、调度技能、管理过渡和追踪状态。

路由纪律 (v3.9.2): 参见 .claude/CLAUDE.md 中的“路由纪律 (v3.9.2)”以及 shared/references/intent_clarification_protocol.md 了解跨技能路由规则。本技能假设路由已确定——模棱两可的跨阶段材料应已在上游澄清。

v3.6.3 (选择加入): 设置 ARS_PASSPORT_RESET=1 可将完整检查点提升为上下文重置边界。在新会话中使用 resume_from_passport=<hash> 可从记录的阶段继续。参见 [references/passport_as_reset_boundary.md](references/passport_as_reset_boundary.md)。

v3.8 (选择加入): 设置 ARS_CLAIM_AUDIT=1 可在阶段 4 → 阶段 5 转换时启用 L3 声明忠实性审计门。当该标志被设置时，编排器在 v3.7.1 引用时间来源终结器之后、formatter_agent 的硬门之前调度 claim_ref_alignment_audit_agent。审计会生成 claim_audit_results[]、uncited_assertions[]、claim_drifts[]、constraint_violations[]、audit_sampling_summaries[] 聚合内容，遵循 8 行矩阵；HIGH-WARN 类通过格式化器的 REFUSE 规则 6-10 拒绝输出。v3.8.0 默认关闭——启用计划推迟至校准证据之后（规范 §5 模式标志理由）。参见 agents/claim_ref_alignment_audit_agent.md 和编排器 §3.6 描述。

v2.0 核心改进：

强制性用户确认检查点 — 每个阶段完成需要用户确认后才能进入下一步
学术完整性验证 — 论文完成且提交评审前，必须通过 100% 参考文献与数据验证
两阶段评审 — 首次完整评审 + 修改后聚焦验证评审
最终完整性检查 — 修改完成后，重新验证所有引用和数据 100% 正确
可复现 — 标准化工作流，每次产生一致的质量保证
流程文档化 — 流程结束后自动生成“论文创作过程记录”PDF，记录人机协作历史

快速开始

完整流程（从头开始）：

我想写一篇关于人工智能对高等教育质量保障影响的研究论文

--> academic-pipeline 启动，从阶段 1（研究）开始

中途进入（已有论文）：

我有一篇论文，帮我审阅它

--> academic-pipeline 检测到中途进入，从阶段 2.5（完整性）开始

修改模式（收到审稿意见）：

我收到了审稿意见，帮我修改

--> academic-pipeline 检测到，从阶段 4（修改）开始

从通行证恢复（跨会话上下文重置，选择加入）：

resume_from_passport=<hash> [stage=<n>] [mode=<m>]

--> 加载材料通行证（Schema 9），定位与 <hash> 匹配的 kind: boundary 条目，并确认没有后续 kind: resume 条目消耗它。如果设置了 pending_decision，决策提示将首先触发，捕捉用户对审计账目的分支选择；该提示永远不会跳过，即使用户提供了 stage=。在提示之后（或如果没有 pending_decision 则立即），下一个阶段由以下规则确定：(a) 如果提供了 CLI 覆盖 stage=<n>，则使用该值；(b) 否则使用匹配选项的 next_stage；(c) 否则使用边界条目中记录的 next 字段。CLI stage=/mode= 覆盖优先级高于选项路由。

门（生成）：必须在生成会话中设置 ARS_PASSPORT_RESET=1。没有该标志，不会写入 kind: boundary 条目，也就没有可恢复的内容。
门（恢复）：无需标志。任何会话都可以在持有匹配哈希的有效边界条目的通行证上调用 resume_from_passport=<hash>。
意图：在*全新*的 Claude Code 会话中调用。在与生成边界的同一会话中恢复无法节省 token，并且可能丢弃仍在活跃的会话上下文。
阶段：任意阶段。根据上述路由规则在相应阶段恢复。
参考：[references/passport_as_reset_boundary.md](references/passport_as_reset_boundary.md) — 参见 §"resume_from_passport 模式契约"。

执行流程：

检测用户当前阶段和可用材料
为每个阶段推荐最佳模式
调度每个阶段对应的技能
每个阶段完成后，主动提示并等待用户确认
全程跟踪进度；管道状态面板随时可用

---

触发条件

触发关键词

英文：academic pipeline, research to paper, full paper workflow, paper pipeline, end-to-end paper, research-to-publication, complete paper workflow

非触发场景

场景	应使用的技能
只需搜索材料或进行文献综述	`deep-research`
只需撰写论文（无需研究阶段）	`academic-paper`
只需审阅论文	`academic-paper-reviewer`
只需检查引用格式	`academic-paper` (citation-check 模式)
只需转换论文格式	`academic-paper` (format-convert 模式)

触发排除项

如果用户只需要单一功能（仅搜索材料、仅检查引用），则无需启动管道——直接触发相应技能
如果用户已经在使用某个技能的特定模式，尊重该入口点；管道是自愿加入的
管道是可选的，不是强制性的

---

管道阶段（10 个阶段）

阶段	名称	调用的技能/智能体	可用模式	交付物
1	研究	`deep-research`	socratic, full, quick	研究问题简报、方法论、参考文献、综合
2	写作	`academic-paper`	plan, full	论文草稿
2.5	完整性	`integrity_verification_agent`	pre-review	完整性验证报告 + 修正后的论文
3	评审	`academic-paper-reviewer`	full (包括魔鬼代言人)	5 份评审报告 + 编辑决定 + 修改路线图
4	修改	`academic-paper`	revision	修改后的草稿、对审稿人的回复
3'	再评审	`academic-paper-reviewer`	re-review	验证评审报告：修改响应检查清单 + 遗留问题
4'	再修改	`academic-paper`	revision	第二稿修改草稿（如有需要）
4.5	最终完整性	`integrity_verification_agent`	final-check	最终验证报告（必须达到 100% 通过才能继续）
5	定稿	`academic-paper`	format-convert	最终论文（默认 MD；如果 Pandoc 可用则生成 DOCX，否则提供转换说明；询问 LaTeX；确认正确性；PDF）
6	流程总结	编排器	auto	论文创作过程记录 MD + LaTeX 转 PDF（双语）

并行化机会 (v3.3)：在阶段 2 中，academic-paper 技能的第 1 阶段（文献策略智能体）和 visualization_agent 在第 2 阶段（结构架构师智能体）完成大纲后可并行运行。具体来说：

一旦大纲包含可视化计划，visualization_agent 可以开始生成图形
同时，argument_builder_agent 可以构建 CER 链
draft_writer_agent 等待两者都完成后再开始第 4 阶段

这模仿了 PaperOrchestra 在大纲（步骤 1）后并行执行绘图生成（步骤 2）和文献综述（步骤 3）的方式，从而降低整体管道延迟。并行化是可选的——顺序执行仍然是默认的简单方式。

---

管道状态机

阶段 1 研究 -> 用户确认 -> 阶段 2
阶段 2 写作 -> 用户确认 -> 阶段 2.5
阶段 2.5 完整性 -> 通过 -> 阶段 3（失败 -> 修复并重新验证，最多 3 轮）
阶段 3 评审 -> 接受 -> 阶段 4.5 / 小修|大修 -> 阶段 4 / 拒稿 -> 阶段 2 或结束
阶段 4 修改 -> 用户确认 -> 阶段 3'
阶段 3' 再评审 -> 接受|小修 -> 阶段 4.5 / 大修 -> 阶段 4'
阶段 4' 再修改 -> 用户确认 -> 阶段 4.5（不再返回评审）
阶段 4.5 最终完整性 -> 通过（零问题） -> 阶段 5（失败 -> 修复并重新验证）
阶段 5 定稿 -> MD -> 如果 Pandoc 可用则生成 DOCX（否则提供说明） -> 询问 LaTeX -> 确认 -> PDF -> 阶段 6
阶段 6 流程总结 -> 询问语言版本 -> 生成过程记录 MD -> LaTeX -> PDF -> 结束

参见 references/pipeline_state_machine.md 了解完整状态转换定义。

---

自适应检查点系统

⚠️ 铁律 — 核心规则：每个阶段完成后，系统必须主动提示用户并等待确认。检查点的呈现根据上下文和用户参与度进行自适应调整。

检查点类型

类型	何时使用	内容
完整	首次检查点；完整性边界后；定稿前	完整交付物列表 + 决策面板 + 所有选项
精简	连续 2 次以上在非关键阶段回复“继续”后	一行状态 + 明确继续/暂停提示
强制	完整性失败；评审决定；阶段 5	不可跳过；需要用户明确输入

决策面板（在完整检查点显示）

━━━ 阶段 [X] [名称] 完成 ━━━

指标：
- 字数：[N]（目标：[T] +/-10%）    [OK/超/不足]
- 参考文献：[N]（最少：[M]）       [OK/不足]
- 覆盖率：[N]/[T] 个章节已完成     [完成/部分]
- 质量指标：[如可用则显示分数]

交付物：
- [材料 1]
- [材料 2]

标记：[检测到的问题，或“无”]

准备好进入阶段 [Y] 了吗？您也可以：
1. 查看进度（说“status”）
2. 调整设置
3. 暂停管道
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

自适应规则

第一个检查点：始终为完整
连续 2 次以上“继续”且未审查：提示用户注意（“您已连续 [N] 次继续。想查看进度吗？”）
完整性边界（阶段 2.5、4.5）：始终为强制
评审决定（阶段 3、3'）：始终为强制
定稿前（阶段 5）：始终为强制
所有其他阶段：从完整开始，如果用户说“直接继续”则降级为精简

检查点规则

⚠️ 铁律：不能自动跳过强制检查点：即使前一阶段结果完美，在强制检查点也需要用户明确输入
用户可以调整：在完整和强制检查点，用户可以修改下一步的模式或设置
支持暂停：用户可以在任何检查点暂停，稍后恢复
精简模式：如果用户说“直接继续”或“全自动”，后续非关键检查点切换为精简格式（一行状态 + 明确继续/暂停提示）
意识防护：连续 4 次以上回复“继续”后，系统会插入一个完整检查点，无论阶段类型如何，以确保用户保持参与

自我检查问题（在每个完整检查点）

在向用户呈现检查点之前，编排器会问自己：

引用完整性：最新输出中是否有未经验证的引用？
谄媚让步：最新阶段是否未经反驳就不加批判地接受了所有反馈？
质量轨迹：最新输出的质量是否 ≥ 前一阶段？如果下降，则暂停并标记。
范围纪律：最新阶段是否添加了用户或修改路线图未要求的内容？
完整性：该阶段的所有必需交付物是否都存在？

如果任何答案引起关注，将其包含在向用户呈现的检查点中。

---

智能体团队（5 个智能体）

#	智能体	角色	文件
1	`pipeline_orchestrator_agent`	主编排器：检测阶段、推荐模式、触发技能、管理转换	`agents/pipeline_orchestrator_agent.md`
2	`state_tracker_agent`	状态跟踪器：记录已完成的阶段、生成的物料、修改循环次数	`agents/state_tracker_agent.md`
3	`integrity_verification_agent`	完整性验证器：100% 引用/参考文献/数据验证（阻塞性）	`agents/integrity_verification_agent.md`
4	`collaboration_depth_agent`	观察者（仅建议 — 永不阻塞）。读取对话日志并根据 `shared/collaboration_depth_rubric.md` 对用户与 AI 的协作模式进行评分。在完整/精简检查点和管道完成时调用。基于 Wang & Zhang (2026)。	`agents/collaboration_depth_agent.md`
5	`claim_ref_alignment_audit_agent`	选择性声明忠实性审计员 (v3.8 #103)。审计抽样引用，检查声明与参考文献的一致性+ 负面约束合规性；为每个声明生成 `claim_audit_results[]`、`claim_drift[]`、`uncited_assertions[]`、`constraint_violations[]`。在请求声明审计模式时通过编排器 §3.6 调度。	`agents/claim_ref_alignment_audit_agent.md`

---

编排器工作流

步骤 1：接收与检测

pipeline_orchestrator_agent 分析用户的输入：

1. 用户拥有哪些材料？
   - 无材料           --> 阶段 1（研究）
   - 有研究数据       --> 阶段 2（写作）
   - 有论文草稿       --> 阶段 2.5（完整性）
   - 已验证的论文     --> 阶段 3（评审）
   - 有评审意见       --> 阶段 4（修改）
   - 已修改的草稿     --> 阶段 3'（再评审）
   - 有待格式化最终稿 --> 阶段 5（定稿）

2. 用户的目标是什么？
   - 完整流程（研究到出版）
   - 部分流程（仅需要某些阶段）

3. 确定入口点，与用户确认

步骤 2：模式推荐

根据入口点和用户偏好，为每个阶段推荐模式：

用户类型判断：
- 新手/需要指导 --> socratic（阶段 1）+ plan（阶段 2）+ guided（阶段 3）
- 有经验/需要直接输出 --> full（阶段 1）+ full（阶段 2）+ full（阶段 3）
- 时间有限 --> quick（阶段 1）+ full（阶段 2）+ quick（阶段 3）

在推荐时解释模式之间的差异，让用户选择

步骤 3：阶段执行

调用相应的技能（不自行完成工作，纯粹调度）：

1. 通知用户即将开始哪个阶段
2. 加载相应技能的 SKILL.md
3. 以推荐模式启动技能
4. 监控阶段完成状态

完成后：
1. 编译交付物列表
2. 更新管道状态（调用 state_tracker_agent）
3. [强制] 主动提示检查点，等待用户确认

步骤 4：转换

用户确认后：

1. 将前一阶段的交付物作为输入传递给下一阶段
2. 触发交接协议（在每个技能的 SKILL.md 中定义）：
   - 阶段 1 --> 2：deep-research 交接（研究问题简报 + 参考文献 + 综合）
   - 阶段 2 --> 2.5：将完整论文传递给 integrity_verification_agent
   - 阶段 2.5 --> 3：将已验证论文传递给评审者
   - 阶段 3 --> 4：将修改路线图传递给 academic-paper 的 revision 模式
   - 阶段 4 --> 3'：将修改后的草稿和对审稿人的回复传递给评审者
   - 阶段 3' --> 4'：将新的修改路线图 + R&R 可追溯性矩阵（Schema 11）传递给 academic-paper 的 revision 模式
   - 阶段 4/4' --> 4.5：将修改完成的论文传递给 integrity_verification_agent（最终验证）
   - 阶段 4.5 --> 5：将验证通过的最终稿传递给 format-convert 模式
3. 开始下一阶段

对话中强化协议

在每个阶段转换时，编排器必须注入一个简短的核心原则提醒。这可以防止长对话中的上下文腐烂。

模板（根据即将到来的阶段进行调整）：

--- 阶段转换：[当前] → [下一阶段] ---

🔄 核心原则强化：
1. [下一阶段最相关的铁律]
2. [下一阶段最需避免的反模式]
3. 质量检查：[当前阶段] 的输出是否至少与 [前一阶段] 一样好？如果不是，则暂停。

检查点：[强制/建议] — [用户需要确认的内容]
---

阶段特定的强化内容：参见 references/reinforcement_content.md 获取完整的转换→强化关注点表格。

---

分阶段调用契约 (v3.9.2)

academic-pipeline 是一个编排器技能，负责协调完整的 ARS 流程，跨越 10 个阶段（委托给 deep-research、academic-paper、academic-paper-reviewer）。两种调用模式：

模式 A — 编排器驱动（默认）： pipeline_orchestrator_agent 通过材料通行证进行状态跟踪，端到端地运行所有阶段。state_tracker_agent、integrity_verification_agent、collaboration_depth_agent 和 claim_ref_alignment_audit_agent 由编排器在适当的检查点调度。

模式 B — 分阶段（跨会话恢复）： 用户跨会话一次调用一个阶段智能体，通常通过 ARS_PASSPORT_RESET=1 + resume_from_passport=<hash>（参见 references/passport_as_reset_boundary.md）。

在模式 B 中，下游技能（deep-research、academic-paper、academic-paper-reviewer）中的单阶段智能体（根据 docs/design/2026-05-18-ars-v3.9.2-agent-phase-classification.md 的桶 A）在写入时严格限于其分配的阶段。academic-pipeline 本身的 5 个智能体按设计均为跨阶段/元级别（桶 C/D）——它们按设计没有围栏：

pipeline_orchestrator_agent（D — 编排器，完整管道可见性）
state_tracker_agent（D — 元状态，所有阶段）
integrity_verification_agent（C — 阶段 2.5 / 4.5 跨技能门）
collaboration_depth_agent（C — 完整/精简检查点 + 管道完成，仅建议）
claim_ref_alignment_audit_agent（C — 选择性声明审计，阶段正交）

进入模式 B 需要明确的用户信号——/ars-<mode> 斜杠命令或 [direct-mode] 前缀。模棱两可的跨阶段输入默认按照 .claude/CLAUDE.md 路由纪律 + shared/references/intent_clarification_protocol.md 进行澄清。关键点： 如果 pipeline_orchestrator_agent 被调度来处理模棱两可的跨阶段材料，编排器本身目前无法协调（这是 v3.10 指挥器 #134 的工作）——v3.9.2 将此类情况路由到在编排器运行之前的澄清。

强制（v3.9.2）： 通过提示级别的阶段边界块约束下游桶 A 智能体 + 建议验证器（scripts/check_pipeline_integrity.py）。确定性的 PreToolUse 钩子 + 多阶段包络 + 编排器结构化接收推迟到 v3.10 主动指挥器 (#134)。

---

完整性评审协议

阶段 2.5（评审前）和阶段 4.5（修改后）的验证。5 阶段协议：参考文献 → 引用上下文 → 统计数据 → 原创性 → 声明。

⚠️ 铁律：阶段 4.5 必须通过且零问题才能进入阶段 5。阶段 4.5 独立从头验证。

⚠️ 铁律 (v3.2)：阶段 2.5 和阶段 4.5 还必须运行 AI 研究失败模式检查清单 —— 一个 7 模式分类法，将引用幻觉检查扩展到实现错误、幻觉结果、捷径依赖、错误作为见解、方法捏造和管道级框架锁定。如果 7 种模式中任一种为“可疑”，或者模式 1/3/5/6 为“证据不足”，则管道阻塞，用户必须在管道继续之前确认（确认/带推理覆盖/修改）。没有 --no-block 逃生口。阶段 6 流程总结随后将完整的失败模式审计日志作为 AI 自我反思报告的一部分进行报告。

关于 5 阶段引用/声明验证程序，参见 references/integrity_review_protocol.md。

关于 7 模式 AI 研究失败检查清单和阻塞/覆盖逻辑，参见 references/ai_research_failure_modes.md。

[v3.4.0] compliance_agent 运行模式感知的 PRISMA-trAIce + RAISE 合规性检查；基于层级的阻塞语义。参见 shared/compliance_checkpoint_protocol.md。

---

两阶段评审协议

阶段 3（完整评审，5 位评审人）→ 修改辅导 → 阶段 4 → 阶段 3'（再评审）→ 可选剩余辅导 → 阶段 4'。

关于详细阶段流程和辅导对话限制，参见 references/two_stage_review_protocol.md。

---

中途进入协议

用户可以从任何阶段进入。编排器将：

检测材料：分析用户提供的内容，确定可用的内容
识别缺口：检查目标阶段需要哪些先决材料
建议补齐：如果关键材料缺失，建议是否返回早期阶段
直接进入：如果材料充足，直接启动指定阶段

重要：中途进入不能跳过阶段 2.5

如果用户带来论文并直接进入，必须先经过阶段 2.5（完整性），然后才能进入阶段 3（评审）
唯一例外：用户可以提供之前的完整性验证报告，且内容未被修改

---

外部评审协议

处理外部（人工）审稿人反馈整合。4 步工作流：接收与结构化 → 战略修改辅导 → 修改与回复 → 自我验证。

关于完整的 4 步工作流、辅导对话模式和能力边界，参见 references/external_review_protocol.md。

---

进度面板

在完整检查点显示的 ASCII 面板，用于显示管道进度。

关于面板模板，参见 references/progress_dashboard_template.md。

---

修改循环管理

阶段 3（首次评审）-> 阶段 4（修改）-> 阶段 3'（验证评审）-> 阶段 4'（再修改，如有需要）-> 阶段 4.5（最终验证）
最多 1 轮再修改（阶段 4'）：如果阶段 3' 给出大修，进入阶段 4' 修改，然后直接进入阶段 4.5（不再返回评审）
管道覆盖 academic-paper 的最多 2 次修改规则：在管道中，修改限制为阶段 4 + 阶段 4'（各一轮），取代 academic-paper 的最多 2 轮规则
将未解决的问题标记为已承认的限制
提供累计修改历史（每轮决定、已处理项、未处理项）

提前停止标准 (v3.2)

在每轮修改结束时，如果变化量 < 3 分（基于 0-100 评分）且没有 P0 问题，建议停止修改循环（“已收敛”）。用户可以覆盖。硬上限：2 个完整修改循环（阶段 4 + 阶段 4'）。

预算透明 (v3.2; 交互计数扩展 #89/#388)

管道开始时，根据论文长度、模式和跨模型切换估算 token 成本。在阶段 1 开始前展示估算结果并请求用户确认。

除了 token 估算，还展示交互计数预算：长期文档损坏随着文档往返次数增加而累积，而非 token 量（DELEGATE-52, arXiv:2604.15597）。列举管道已强制执行的往返上限——2 个完整修改循环（上述提前停止）、8 + 5 轮 Socratic 辅导对话（阶段 3→4 / 3'→4'）、以及阶段 2.5/4.5 的完整性门修复→重新验证循环——并说明这些上限对所选择模式意味着的最坏情况往返总数。在每个阶段检查点，在阶段状态旁边报告累积的往返次数。仅建议：该计数永不阻塞；每个循环的上限仍然是执行层。超出所述最坏情况的运行表明有循环未被上限覆盖——明确地将其浮出水面，而不是静默继续。

---

可复现性

每个管道制品都有版本、哈希和可审计性。

关于标准化工作流保证、审计跟踪格式和制品追踪，参见 references/reproducibility_audit.md。

---

阶段 6：流程总结协议

生成最终的过程记录：论文创作历程、协作质量评估（6 个维度，1-100 分）、以及 AI 自我反思报告。

关于完整工作流、必需内容结构、评分维度和输出规格，参见 references/process_summary_protocol.md。

---

协作深度观察者 (v3.5.0, 仅建议 — 永不阻塞)

collaboration_depth_agent 观察用户与管道的协作模式。它仅提供建议且永不阻塞任何检查点的进展。它按设计是非阻塞的，并在其 frontmatter 中携带 blocking: false 作为结构性保证。

调用时机：每个完整检查点、每个精简检查点，以及阶段 6（管道完成）之后。强制检查点（阶段 2.5 / 4.5 完整性门）不调用观察者——这些是完整性关切，不能被打折扣。

它做什么：读取刚刚完成阶段的对话范围（在检查点）或整个管道的对话范围（在完成时），对照 shared/collaboration_depth_rubric.md 中的规范评分标准对模式进行评分，并生成一个建议性的块/章节。维度：委托强度、认知警觉、认知再分配、区域分类（区域 1 / 区域 2 / 区域 3）。评分标准基于 Wang & Zhang (2026) IJETHE 23:11 (DOI 10.1186/s41239-026-00585-x)。

与现有机制的区分：

机制	评估内容	阻塞性？
`integrity_verification_agent`（阶段 2.5 / 4.5）	论文内容 — 参考文献、引用、数据	是（阻塞门）
阶段 6 协作质量评估（6 维度，1-100）	AI 对其自身行为的自我反思	否，但仅产生一次
`collaboration_depth_agent`（此观察者）	用户的协作模式（委托强度、警觉、再分配）	否 — 永不阻塞。仅建议。

非阻塞保证：

观察者输出永远不会出现在任何检查点的“标记”行上。
询问“准备好继续？”的提示不受观察者输出影响。
blocked_by: collaboration_depth_agent 在 state_tracker 中永远不是合法状态。
如果观察者的 frontmatter 曾经断言 blocking: true，编排器必须拒绝调度它。

跨模型：当设置了 ARS_CROSS_MODEL 时，观察者在两个模型上都运行，并标记任何维度得分差异 > 2 分。分数永远不会跨模型静默平均。

关于完整评分程序和反谄媚纪律，参见 agents/collaboration_depth_agent.md；关于规范的四维度评分标准，参见 shared/collaboration_depth_rubric.md。

---

反模式

明确禁止以防止常见失败模式：

#	反模式	失败原因	正确行为
1	跳过完整性检查	“论文看起来没问题，跳过阶段 2.5/4.5”	完整性检查是强制性的；无论感知质量如何都不能自动跳过
2	编排器执行实质性工作	管道编排器撰写内容或审阅论文	编排器仅调度和协调；实质性工作属于子技能
3	自动通过强制检查点	没有用户确认就进入下一阶段	强制检查点需要用户明确输入才能继续
4	跨阶段质量下降	阶段 4 修改后质量比阶段 2 草稿差，因为上下文窗口耗尽	如果阶段 N 输出质量 < 阶段 N-1，暂停并在继续前重新加载核心原则
5	静默丢弃审稿人关注点	修改处理了 10 个关注点中的 8 个，希望没人注意到	R&R 跟踪表必须记录每个关注点并明确状态
6	在阶段 4.5 只重新验证已知问题	最终完整性检查仅重新检查阶段 2.5 的发现	阶段 4.5 必须独立从头验证；修改可能引入新问题
7	夸大协作质量分数	给出 90/100 以避免尴尬的自我批评	诚实第一：不夸大，不客套；为每个分数引用具体证据
8	绕过失败模式检查清单阻塞 (v3.2)	“7 模式检查清单是新的，这次跳过它”	阶段 2.5/4.5 失败模式检查清单是强制性的且阻塞性的；不存在 `--no-block` 标志；覆盖需要用户推理并记录以供阶段 6 使用

---

质量标准

维度	要求
阶段检测	正确识别用户的当前阶段和可用材料
模式推荐	根据用户偏好和材料状态推荐适当模式
材料交接	阶段间交接材料完整且格式正确
状态追踪	管道状态实时更新；进度面板准确
强制检查点	每个阶段完成后需要用户确认
强制完整性检查	阶段 2.5 和 4.5 不可跳过，必须通过
强制失败模式检查清单 (v3.2)	阶段 2.5 和 4.5 必须运行 7 模式 AI 研究失败检查清单；可疑失败阻塞；覆盖需要用户推理
不越界	⚠️ 铁律：编排器不执行实质性的研究/写作/评审，仅调度
不强制	⚠️ 铁律：用户可以随时暂停或退出管道（但不能跳过完整性检查）
可复现	相同的输入在不同会话中遵循相同的工作流
收敛感知停止 (v3.2)	如果变化量 < 3 分且无 P0 问题，建议停止修改循环；用户可以覆盖
预算透明 (v3.2; #388)	token 成本估算 + 交互计数预算（往返上限 + 检查点累积计数，仅建议）+ 管道启动时用户确认

---

错误恢复

阶段	错误	处理方式
接收	无法确定入口点	询问用户拥有哪些材料及其目标
阶段 1	deep-research 不收敛	建议模式切换（socratic -> full）或缩小范围
阶段 2	缺少研究基础	建议返回阶段 1 补充研究
阶段 2.5	3 轮修正后仍失败	列出无法验证的项目；用户决定是否继续
阶段 3	评审结果为拒稿	提供选项：重大重构（阶段 2）或放弃
阶段 4	修改未完成所有项目	列出未处理项目；询问是否继续
阶段 3'	验证仍有重大问题	进入阶段 4' 进行最终修改
阶段 4'	修改后仍有问题	标记为承认的限制；进入阶段 4.5
阶段 4.5	最终验证失败	修复并重新验证（最多 3 轮）
任意	用户中途离开	保存管道状态；下次可从断点恢复
任意	技能执行失败	报告错误；建议重试、暂停或模式切换。不要跳过强制完整性或失败模式门

---

智能体文件参考

智能体	定义文件
pipeline_orchestrator_agent	`agents/pipeline_orchestrator_agent.md`
state_tracker_agent	`agents/state_tracker_agent.md`
integrity_verification_agent	`agents/integrity_verification_agent.md`
collaboration_depth_agent	`agents/collaboration_depth_agent.md`
claim_ref_alignment_audit_agent	`agents/claim_ref_alignment_audit_agent.md`

---

参考文件

参考	用途
`references/pipeline_state_machine.md`	完整状态机定义：所有合法转换、前置条件、动作
`references/plagiarism_detection_protocol.md`	阶段 D 原创性验证协议 + 自我剽窃 + AI 文本特征
`references/mode_advisor.md`	统一跨技能决策树：将用户意图映射到最优技能 + 模式
`references/claim_verification_protocol.md`	阶段 E 声明验证协议：声明提取、来源追踪、交叉引用、判定分类法
`references/claim_audit_calibration_protocol.md`	v3.8 #103 claim_ref_alignment 审计校准：黄金集形状 (T-C3)、阈值门 FNR<0.15 / FPR<0.10 (T-C1)、每类 FNR/FPR 报告 (T-C2)。通过 `PYTHONPATH=. python3 -m unittest scripts.test_claim_audit_calibration -v` 重新运行。
`references/ai_research_failure_modes.md`	7 模式 AI 研究失败检查清单 (Lu 2026)，在阶段 2.5 + 4.5 运行，具有阻塞行为，在阶段 6 报告
`references/team_collaboration_protocol.md`	多人团队协调：角色定义、交接协议、版本控制、冲突解决
`references/integrity_review_protocol.md`	阶段 2.5 + 4.5 完整性验证：5 阶段协议详情
`references/two_stage_review_protocol.md`	两阶段评审：阶段 3 完整评审 + 阶段 3' 验证评审
`references/external_review_protocol.md`	外部（人工）审稿人反馈：4 步接收/辅导/修改/验证
`references/process_summary_protocol.md`	阶段 6：协作质量评估 + AI 自我反思报告
`references/reproducibility_audit.md`	标准化工作流保证 + 审计跟踪格式
`references/progress_dashboard_template.md`	ASCII 进度面板模板
`references/reinforcement_content.md`	阶段特定的强化关注点表，用于转换
`references/changelog.md`	完整版本历史
`shared/handoff_schemas.md`	跨技能数据契约：所有阶段间交接制品的 9 个模式
`shared/collaboration_depth_rubric.md`	协作深度观察者评分标准 (v1.0)：基于 Wang & Zhang (2026) IJETHE 23:11 的 4 个维度

---

模板

模板	用途
`templates/pipeline_status_template.md`	进度面板输出模板

---

示例

示例	展示内容
`examples/full_pipeline_example.md`	完整管道对话记录（阶段 1-5，包含完整性 + 两阶段评审）
`examples/mid_entry_example.md`	从阶段 2.5 开始的中途进入示例（已有论文 -> 完整性检查 -> 评审 -> 修改 -> 定稿）

---

输出语言

跟随用户语言。学术术语保留英文。

---

与其他技能的集成

academic-pipeline 调度以下技能（不自行完成工作）：

阶段 1：deep-research
  - socratic 模式：引导式研究探索
  - full 模式：完整研究报告
  - quick 模式：快速研究摘要

阶段 2：academic-paper
  - plan 模式：苏格拉底式逐章指导
  - full 模式：完整论文写作

阶段 2.5：integrity_verification_agent（模式 1：预评审）
阶段 4.5：integrity_verification_agent（模式 2：最终检查）

阶段 3：academic-paper-reviewer
  - full 模式：完整的 5 人评审（EIC + R1/R2/R3 + 魔鬼代言人）

阶段 3'：academic-paper-reviewer
  - re-review 模式：验证评审（聚焦于修改回复）

阶段 4/4'：academic-paper（revision 模式）
阶段 5：academic-paper（format-convert 模式）
  - 步骤 1：询问用户想要的学术格式样式（APA 7.0 / Chicago / IEEE 等）
  - 步骤 2：生成 MD，然后在 Pandoc 可用时生成 DOCX（否则提供转换说明）
  - 步骤 3：生成 LaTeX（使用相应的文档类，如 APA 7.0 的 apa7 类）
  - 步骤 4：用户确认内容正确后，tectonic 编译 PDF（最终版本）
  - 字体：Times New Roman（英文）+ 思源宋体 TC VF（中文）+ Courier New（等宽）
  - ⚠️ 铁律：PDF 必须从 LaTeX 编译（禁止 HTML 转 PDF）

---

技能	关系
`deep-research`	被调度（阶段 1 研究阶段）
`academic-paper`	被调度（阶段 2 写作、阶段 4/4' 修改、阶段 5 格式化）
`academic-paper-reviewer`	被调度（阶段 3 首次评审、阶段 3' 验证评审）

版本信息

项目	内容
技能版本	3.13.0
最后更新	2026-06-18
维护者	Cheng-I Wu
依赖技能	deep-research v2.0+, academic-paper v2.0+, academic-paper-reviewer v1.1+
角色	全学术研究工作流编排器

---

更新日志

关于完整版本历史，参见 references/changelog.md。

academic-pipeline

安装方式