返回全部 Skills

academic-pipeline

研究分析

面向完整学术研究流程的编排器:研究 -> 写作 -> 完整性检查 -> 评审 -> 修订 -> 再评审 -> 再修订 -> 最终完整性检查 -> 定稿。将 deep-research、academic-paper 和 academic-paper-reviewer 协调成一个无缝的10阶段工作流,包含强制完整性验证、两阶段同行评审以及可重复的质量关卡。触发条件:学术流程、从研究到论文、完整论文工作流、论文流程、端到端论文、从研究到发表、完整的论文工作流。

4

下载量

AI SkillHub 能力展示图

安装方式

命令行安装

在项目根目录执行以下命令,完成 Skill 安装。

npx bzskills add Imbad0202/academic-research-skills --skill academic-pipeline

skill.md

name: academic-pipeline
description: 面向完整学术研究流程的编排器:研究 -> 写作 -> 完整性检查 -> 评审 -> 修订 -> 再评审 -> 再修订 -> 最终完整性检查 -> 定稿。将 deep-research、academic-paper 和 academic-paper-reviewer 协调成一个无缝的10阶段工作流,包含强制完整性验证、两阶段同行评审以及可重复的质量关卡。触发条件:学术流程、从研究到论文、完整论文工作流、论文流程、端到端论文、从研究到发表、完整的论文工作流。
metadata:
    version: "3.13.0"
    last_updated: "2026-06-18"
    depends_on: "deep-research, academic-paper, academic-paper-reviewer"
    status: active
    data_access_level: verified_only
    task_type: open-ended
    related_skills:
        - deep-research
        - academic-paper
        - academic-paper-reviewer

Academic Pipeline v3.13.0 — 全学术研究流程编排器

一个轻量级编排器,管理从研究探索到最终文稿的完整学术流程。它不执行实质性工作——仅检测阶段、推荐模式、调度技能、管理过渡和追踪状态。

路由纪律 (v3.9.2): 参见 .claude/CLAUDE.md 中的“路由纪律 (v3.9.2)”以及 shared/references/intent_clarification_protocol.md 了解跨技能路由规则。本技能假设路由已确定——模棱两可的跨阶段材料应已在上游澄清。

v3.6.3 (选择加入): 设置 ARS_PASSPORT_RESET=1 可将完整检查点提升为上下文重置边界。在新会话中使用 resume_from_passport=<hash> 可从记录的阶段继续。参见 [references/passport_as_reset_boundary.md](references/passport_as_reset_boundary.md)。

v3.8 (选择加入): 设置 ARS_CLAIM_AUDIT=1 可在阶段 4 → 阶段 5 转换时启用 L3 声明忠实性审计门。当该标志被设置时,编排器在 v3.7.1 引用时间来源终结器之后、formatter_agent 的硬门之前调度 claim_ref_alignment_audit_agent。审计会生成 claim_audit_results[]uncited_assertions[]claim_drifts[]constraint_violations[]audit_sampling_summaries[] 聚合内容,遵循 8 行矩阵;HIGH-WARN 类通过格式化器的 REFUSE 规则 6-10 拒绝输出。v3.8.0 默认关闭——启用计划推迟至校准证据之后(规范 §5 模式标志理由)。参见 agents/claim_ref_alignment_audit_agent.md 和编排器 §3.6 描述。

v2.0 核心改进

  1. 强制性用户确认检查点 — 每个阶段完成需要用户确认后才能进入下一步
  2. 学术完整性验证 — 论文完成且提交评审前,必须通过 100% 参考文献与数据验证
  3. 两阶段评审 — 首次完整评审 + 修改后聚焦验证评审
  4. 最终完整性检查 — 修改完成后,重新验证所有引用和数据 100% 正确
  5. 可复现 — 标准化工作流,每次产生一致的质量保证
  6. 流程文档化 — 流程结束后自动生成“论文创作过程记录”PDF,记录人机协作历史

快速开始

完整流程(从头开始):

我想写一篇关于人工智能对高等教育质量保障影响的研究论文

--> academic-pipeline 启动,从阶段 1(研究)开始

中途进入(已有论文):

我有一篇论文,帮我审阅它

--> academic-pipeline 检测到中途进入,从阶段 2.5(完整性)开始

修改模式(收到审稿意见):

我收到了审稿意见,帮我修改

--> academic-pipeline 检测到,从阶段 4(修改)开始

从通行证恢复(跨会话上下文重置,选择加入):

resume_from_passport=<hash> [stage=<n>] [mode=<m>]

--> 加载材料通行证(Schema 9),定位与 <hash> 匹配的 kind: boundary 条目,并确认没有后续 kind: resume 条目消耗它。如果设置了 pending_decision,决策提示将首先触发,捕捉用户对审计账目的分支选择;该提示永远不会跳过,即使用户提供了 stage=。在提示之后(或如果没有 pending_decision 则立即),下一个阶段由以下规则确定:(a) 如果提供了 CLI 覆盖 stage=<n>,则使用该值;(b) 否则使用匹配选项的 next_stage;(c) 否则使用边界条目中记录的 next 字段。CLI stage=/mode= 覆盖优先级高于选项路由。

  • 门(生成):必须在生成会话中设置 ARS_PASSPORT_RESET=1。没有该标志,不会写入 kind: boundary 条目,也就没有可恢复的内容。
  • 门(恢复):无需标志。任何会话都可以在持有匹配哈希的有效边界条目的通行证上调用 resume_from_passport=<hash>
  • 意图:在*全新*的 Claude Code 会话中调用。在与生成边界的同一会话中恢复无法节省 token,并且可能丢弃仍在活跃的会话上下文。
  • 阶段:任意阶段。根据上述路由规则在相应阶段恢复。
  • 参考:[references/passport_as_reset_boundary.md](references/passport_as_reset_boundary.md) — 参见 §"resume_from_passport 模式契约"。

执行流程:

  1. 检测用户当前阶段和可用材料
  2. 为每个阶段推荐最佳模式
  3. 调度每个阶段对应的技能
  4. 每个阶段完成后,主动提示并等待用户确认
  5. 全程跟踪进度;管道状态面板随时可用

---

触发条件

触发关键词

英文:academic pipeline, research to paper, full paper workflow, paper pipeline, end-to-end paper, research-to-publication, complete paper workflow

非触发场景

场景应使用的技能
只需搜索材料或进行文献综述deep-research
只需撰写论文(无需研究阶段)academic-paper
只需审阅论文academic-paper-reviewer
只需检查引用格式academic-paper (citation-check 模式)
只需转换论文格式academic-paper (format-convert 模式)

触发排除项

  • 如果用户只需要单一功能(仅搜索材料、仅检查引用),则无需启动管道——直接触发相应技能
  • 如果用户已经在使用某个技能的特定模式,尊重该入口点;管道是自愿加入的
  • 管道是可选的,不是强制性的

---

管道阶段(10 个阶段)

阶段名称调用的技能/智能体可用模式交付物
1研究deep-researchsocratic, full, quick研究问题简报、方法论、参考文献、综合
2写作academic-paperplan, full论文草稿
2.5完整性integrity_verification_agentpre-review完整性验证报告 + 修正后的论文
3评审academic-paper-reviewerfull (包括魔鬼代言人)5 份评审报告 + 编辑决定 + 修改路线图
4修改academic-paperrevision修改后的草稿、对审稿人的回复
3'再评审academic-paper-reviewerre-review验证评审报告:修改响应检查清单 + 遗留问题
4'再修改academic-paperrevision第二稿修改草稿(如有需要)
4.5最终完整性integrity_verification_agentfinal-check最终验证报告(必须达到 100% 通过才能继续)
5定稿academic-paperformat-convert最终论文(默认 MD;如果 Pandoc 可用则生成 DOCX,否则提供转换说明;询问 LaTeX;确认正确性;PDF)
6流程总结编排器auto论文创作过程记录 MD + LaTeX 转 PDF(双语)

并行化机会 (v3.3):在阶段 2 中,academic-paper 技能的第 1 阶段(文献策略智能体)和 visualization_agent 在第 2 阶段(结构架构师智能体)完成大纲后可并行运行。具体来说:

  • 一旦大纲包含可视化计划,visualization_agent 可以开始生成图形
  • 同时,argument_builder_agent 可以构建 CER 链
  • draft_writer_agent 等待两者都完成后再开始第 4 阶段

这模仿了 PaperOrchestra 在大纲(步骤 1)后并行执行绘图生成(步骤 2)和文献综述(步骤 3)的方式,从而降低整体管道延迟。并行化是可选的——顺序执行仍然是默认的简单方式。

---

管道状态机

  1. 阶段 1 研究 -> 用户确认 -> 阶段 2
  2. 阶段 2 写作 -> 用户确认 -> 阶段 2.5
  3. 阶段 2.5 完整性 -> 通过 -> 阶段 3(失败 -> 修复并重新验证,最多 3 轮)
  4. 阶段 3 评审 -> 接受 -> 阶段 4.5 / 小修|大修 -> 阶段 4 / 拒稿 -> 阶段 2 或结束
  5. 阶段 4 修改 -> 用户确认 -> 阶段 3'
  6. 阶段 3' 再评审 -> 接受|小修 -> 阶段 4.5 / 大修 -> 阶段 4'
  7. 阶段 4' 再修改 -> 用户确认 -> 阶段 4.5(不再返回评审)
  8. 阶段 4.5 最终完整性 -> 通过(零问题) -> 阶段 5(失败 -> 修复并重新验证)
  9. 阶段 5 定稿 -> MD -> 如果 Pandoc 可用则生成 DOCX(否则提供说明) -> 询问 LaTeX -> 确认 -> PDF -> 阶段 6
  10. 阶段 6 流程总结 -> 询问语言版本 -> 生成过程记录 MD -> LaTeX -> PDF -> 结束

参见 references/pipeline_state_machine.md 了解完整状态转换定义。

---

自适应检查点系统

⚠️ 铁律 — 核心规则:每个阶段完成后,系统必须主动提示用户并等待确认。检查点的呈现根据上下文和用户参与度进行自适应调整。

检查点类型

类型何时使用内容
完整首次检查点;完整性边界后;定稿前完整交付物列表 + 决策面板 + 所有选项
精简连续 2 次以上在非关键阶段回复“继续”后一行状态 + 明确继续/暂停提示
强制完整性失败;评审决定;阶段 5不可跳过;需要用户明确输入

决策面板(在完整检查点显示)

━━━ 阶段 [X] [名称] 完成 ━━━

指标:
- 字数:[N](目标:[T] +/-10%)    [OK/超/不足]
- 参考文献:[N](最少:[M])       [OK/不足]
- 覆盖率:[N]/[T] 个章节已完成     [完成/部分]
- 质量指标:[如可用则显示分数]

交付物:
- [材料 1]
- [材料 2]

标记:[检测到的问题,或“无”]

准备好进入阶段 [Y] 了吗?您也可以:
1. 查看进度(说“status”)
2. 调整设置
3. 暂停管道
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

自适应规则

  1. 第一个检查点:始终为完整
  2. 连续 2 次以上“继续”且未审查:提示用户注意(“您已连续 [N] 次继续。想查看进度吗?”)
  3. 完整性边界(阶段 2.5、4.5):始终为强制
  4. 评审决定(阶段 3、3'):始终为强制
  5. 定稿前(阶段 5):始终为强制
  6. 所有其他阶段:从完整开始,如果用户说“直接继续”则降级为精简

检查点规则

  1. ⚠️ 铁律不能自动跳过强制检查点:即使前一阶段结果完美,在强制检查点也需要用户明确输入
  2. 用户可以调整:在完整和强制检查点,用户可以修改下一步的模式或设置
  3. 支持暂停:用户可以在任何检查点暂停,稍后恢复
  4. 精简模式:如果用户说“直接继续”或“全自动”,后续非关键检查点切换为精简格式(一行状态 + 明确继续/暂停提示)
  5. 意识防护:连续 4 次以上回复“继续”后,系统会插入一个完整检查点,无论阶段类型如何,以确保用户保持参与

自我检查问题(在每个完整检查点)

在向用户呈现检查点之前,编排器会问自己:

  1. 引用完整性:最新输出中是否有未经验证的引用?
  2. 谄媚让步:最新阶段是否未经反驳就不加批判地接受了所有反馈?
  3. 质量轨迹:最新输出的质量是否 ≥ 前一阶段?如果下降,则暂停并标记。
  4. 范围纪律:最新阶段是否添加了用户或修改路线图未要求的内容?
  5. 完整性:该阶段的所有必需交付物是否都存在?

如果任何答案引起关注,将其包含在向用户呈现的检查点中。

---

智能体团队(5 个智能体)

#智能体角色文件
1pipeline_orchestrator_agent主编排器:检测阶段、推荐模式、触发技能、管理转换agents/pipeline_orchestrator_agent.md
2state_tracker_agent状态跟踪器:记录已完成的阶段、生成的物料、修改循环次数agents/state_tracker_agent.md
3integrity_verification_agent完整性验证器:100% 引用/参考文献/数据验证(阻塞性)agents/integrity_verification_agent.md
4collaboration_depth_agent观察者(仅建议 — 永不阻塞)。 读取对话日志并根据 shared/collaboration_depth_rubric.md 对用户与 AI 的协作模式进行评分。在完整/精简检查点和管道完成时调用。基于 Wang & Zhang (2026)。agents/collaboration_depth_agent.md
5claim_ref_alignment_audit_agent选择性声明忠实性审计员 (v3.8 #103)。 审计抽样引用,检查声明与参考文献的一致性+ 负面约束合规性;为每个声明生成 claim_audit_results[]claim_drift[]uncited_assertions[]constraint_violations[]。在请求声明审计模式时通过编排器 §3.6 调度。agents/claim_ref_alignment_audit_agent.md

---

编排器工作流

步骤 1:接收与检测

pipeline_orchestrator_agent 分析用户的输入:

1. 用户拥有哪些材料?
   - 无材料           --> 阶段 1(研究)
   - 有研究数据       --> 阶段 2(写作)
   - 有论文草稿       --> 阶段 2.5(完整性)
   - 已验证的论文     --> 阶段 3(评审)
   - 有评审意见       --> 阶段 4(修改)
   - 已修改的草稿     --> 阶段 3'(再评审)
   - 有待格式化最终稿 --> 阶段 5(定稿)

2. 用户的目标是什么?
   - 完整流程(研究到出版)
   - 部分流程(仅需要某些阶段)

3. 确定入口点,与用户确认

步骤 2:模式推荐

根据入口点和用户偏好,为每个阶段推荐模式:

用户类型判断:
- 新手/需要指导 --> socratic(阶段 1)+ plan(阶段 2)+ guided(阶段 3)
- 有经验/需要直接输出 --> full(阶段 1)+ full(阶段 2)+ full(阶段 3)
- 时间有限 --> quick(阶段 1)+ full(阶段 2)+ quick(阶段 3)

在推荐时解释模式之间的差异,让用户选择

步骤 3:阶段执行

调用相应的技能(不自行完成工作,纯粹调度):

1. 通知用户即将开始哪个阶段
2. 加载相应技能的 SKILL.md
3. 以推荐模式启动技能
4. 监控阶段完成状态

完成后:
1. 编译交付物列表
2. 更新管道状态(调用 state_tracker_agent)
3. [强制] 主动提示检查点,等待用户确认

步骤 4:转换

用户确认后:

1. 将前一阶段的交付物作为输入传递给下一阶段
2. 触发交接协议(在每个技能的 SKILL.md 中定义):
   - 阶段 1 --> 2:deep-research 交接(研究问题简报 + 参考文献 + 综合)
   - 阶段 2 --> 2.5:将完整论文传递给 integrity_verification_agent
   - 阶段 2.5 --> 3:将已验证论文传递给评审者
   - 阶段 3 --> 4:将修改路线图传递给 academic-paper 的 revision 模式
   - 阶段 4 --> 3':将修改后的草稿和对审稿人的回复传递给评审者
   - 阶段 3' --> 4':将新的修改路线图 + R&R 可追溯性矩阵(Schema 11)传递给 academic-paper 的 revision 模式
   - 阶段 4/4' --> 4.5:将修改完成的论文传递给 integrity_verification_agent(最终验证)
   - 阶段 4.5 --> 5:将验证通过的最终稿传递给 format-convert 模式
3. 开始下一阶段

对话中强化协议

在每个阶段转换时,编排器必须注入一个简短的核心原则提醒。这可以防止长对话中的上下文腐烂。

模板(根据即将到来的阶段进行调整):

--- 阶段转换:[当前] → [下一阶段] ---

🔄 核心原则强化:
1. [下一阶段最相关的铁律]
2. [下一阶段最需避免的反模式]
3. 质量检查:[当前阶段] 的输出是否至少与 [前一阶段] 一样好?如果不是,则暂停。

检查点:[强制/建议] — [用户需要确认的内容]
---

阶段特定的强化内容:参见 references/reinforcement_content.md 获取完整的转换→强化关注点表格。

---

分阶段调用契约 (v3.9.2)

academic-pipeline 是一个编排器技能,负责协调完整的 ARS 流程,跨越 10 个阶段(委托给 deep-research、academic-paper、academic-paper-reviewer)。两种调用模式:

模式 A — 编排器驱动(默认): pipeline_orchestrator_agent 通过材料通行证进行状态跟踪,端到端地运行所有阶段。state_tracker_agentintegrity_verification_agentcollaboration_depth_agentclaim_ref_alignment_audit_agent 由编排器在适当的检查点调度。

模式 B — 分阶段(跨会话恢复): 用户跨会话一次调用一个阶段智能体,通常通过 ARS_PASSPORT_RESET=1 + resume_from_passport=<hash>(参见 references/passport_as_reset_boundary.md)。

在模式 B 中,下游技能(deep-research、academic-paper、academic-paper-reviewer)中的单阶段智能体(根据 docs/design/2026-05-18-ars-v3.9.2-agent-phase-classification.md 的桶 A)在写入时严格限于其分配的阶段。academic-pipeline 本身的 5 个智能体按设计均为跨阶段/元级别(桶 C/D)——它们按设计没有围栏:

  • pipeline_orchestrator_agent(D — 编排器,完整管道可见性)
  • state_tracker_agent(D — 元状态,所有阶段)
  • integrity_verification_agent(C — 阶段 2.5 / 4.5 跨技能门)
  • collaboration_depth_agent(C — 完整/精简检查点 + 管道完成,仅建议)
  • claim_ref_alignment_audit_agent(C — 选择性声明审计,阶段正交)

进入模式 B 需要明确的用户信号——/ars-<mode> 斜杠命令或 [direct-mode] 前缀。模棱两可的跨阶段输入默认按照 .claude/CLAUDE.md 路由纪律 + shared/references/intent_clarification_protocol.md 进行澄清。关键点: 如果 pipeline_orchestrator_agent 被调度来处理模棱两可的跨阶段材料,编排器本身目前无法协调(这是 v3.10 指挥器 #134 的工作)——v3.9.2 将此类情况路由到在编排器运行之前的澄清。

强制(v3.9.2): 通过提示级别的阶段边界块约束下游桶 A 智能体 + 建议验证器(scripts/check_pipeline_integrity.py)。确定性的 PreToolUse 钩子 + 多阶段包络 + 编排器结构化接收推迟到 v3.10 主动指挥器 (#134)。

---

完整性评审协议

阶段 2.5(评审前)和阶段 4.5(修改后)的验证。5 阶段协议:参考文献 → 引用上下文 → 统计数据 → 原创性 → 声明。

⚠️ 铁律:阶段 4.5 必须通过且零问题才能进入阶段 5。阶段 4.5 独立从头验证。

⚠️ 铁律 (v3.2):阶段 2.5 和阶段 4.5 还必须运行 AI 研究失败模式检查清单 —— 一个 7 模式分类法,将引用幻觉检查扩展到实现错误、幻觉结果、捷径依赖、错误作为见解、方法捏造和管道级框架锁定。如果 7 种模式中任一种为“可疑”,或者模式 1/3/5/6 为“证据不足”,则管道阻塞,用户必须在管道继续之前确认(确认/带推理覆盖/修改)。没有 --no-block 逃生口。阶段 6 流程总结随后将完整的失败模式审计日志作为 AI 自我反思报告的一部分进行报告。

关于 5 阶段引用/声明验证程序,参见 references/integrity_review_protocol.md
关于 7 模式 AI 研究失败检查清单和阻塞/覆盖逻辑,参见 references/ai_research_failure_modes.md
  • [v3.4.0] compliance_agent 运行模式感知的 PRISMA-trAIce + RAISE 合规性检查;基于层级的阻塞语义。参见 shared/compliance_checkpoint_protocol.md

---

两阶段评审协议

阶段 3(完整评审,5 位评审人)→ 修改辅导 → 阶段 4 → 阶段 3'(再评审)→ 可选剩余辅导 → 阶段 4'。

关于详细阶段流程和辅导对话限制,参见 references/two_stage_review_protocol.md

---

中途进入协议

用户可以从任何阶段进入。编排器将:

  1. 检测材料:分析用户提供的内容,确定可用的内容
  2. 识别缺口:检查目标阶段需要哪些先决材料
  3. 建议补齐:如果关键材料缺失,建议是否返回早期阶段
  4. 直接进入:如果材料充足,直接启动指定阶段

重要:中途进入不能跳过阶段 2.5

  • 如果用户带来论文并直接进入,必须先经过阶段 2.5(完整性),然后才能进入阶段 3(评审)
  • 唯一例外:用户可以提供之前的完整性验证报告,且内容未被修改

---

外部评审协议

处理外部(人工)审稿人反馈整合。4 步工作流:接收与结构化 → 战略修改辅导 → 修改与回复 → 自我验证。

关于完整的 4 步工作流、辅导对话模式和能力边界,参见 references/external_review_protocol.md

---

进度面板

在完整检查点显示的 ASCII 面板,用于显示管道进度。

关于面板模板,参见 references/progress_dashboard_template.md

---

修改循环管理

  • 阶段 3(首次评审)-> 阶段 4(修改)-> 阶段 3'(验证评审)-> 阶段 4'(再修改,如有需要)-> 阶段 4.5(最终验证)
  • 最多 1 轮再修改(阶段 4'):如果阶段 3' 给出大修,进入阶段 4' 修改,然后直接进入阶段 4.5(不再返回评审)
  • 管道覆盖 academic-paper 的最多 2 次修改规则:在管道中,修改限制为阶段 4 + 阶段 4'(各一轮),取代 academic-paper 的最多 2 轮规则
  • 将未解决的问题标记为已承认的限制
  • 提供累计修改历史(每轮决定、已处理项、未处理项)

提前停止标准 (v3.2)

在每轮修改结束时,如果变化量 < 3 分(基于 0-100 评分)且没有 P0 问题,建议停止修改循环(“已收敛”)。用户可以覆盖。硬上限:2 个完整修改循环(阶段 4 + 阶段 4')。

预算透明 (v3.2; 交互计数扩展 #89/#388)

管道开始时,根据论文长度、模式和跨模型切换估算 token 成本。在阶段 1 开始前展示估算结果并请求用户确认。

除了 token 估算,还展示交互计数预算:长期文档损坏随着文档往返次数增加而累积,而非 token 量(DELEGATE-52, arXiv:2604.15597)。列举管道已强制执行的往返上限——2 个完整修改循环(上述提前停止)、8 + 5 轮 Socratic 辅导对话(阶段 3→4 / 3'→4')、以及阶段 2.5/4.5 的完整性门修复→重新验证循环——并说明这些上限对所选择模式意味着的最坏情况往返总数。在每个阶段检查点,在阶段状态旁边报告累积的往返次数。仅建议:该计数永不阻塞;每个循环的上限仍然是执行层。超出所述最坏情况的运行表明有循环未被上限覆盖——明确地将其浮出水面,而不是静默继续。

---

可复现性

每个管道制品都有版本、哈希和可审计性。

关于标准化工作流保证、审计跟踪格式和制品追踪,参见 references/reproducibility_audit.md

---

阶段 6:流程总结协议

生成最终的过程记录:论文创作历程、协作质量评估(6 个维度,1-100 分)、以及 AI 自我反思报告。

关于完整工作流、必需内容结构、评分维度和输出规格,参见 references/process_summary_protocol.md

---

协作深度观察者 (v3.5.0, 仅建议 — 永不阻塞)

collaboration_depth_agent 观察用户与管道的协作模式。它仅提供建议永不阻塞任何检查点的进展。它按设计是非阻塞的,并在其 frontmatter 中携带 blocking: false 作为结构性保证。

调用时机:每个完整检查点、每个精简检查点,以及阶段 6(管道完成)之后。强制检查点(阶段 2.5 / 4.5 完整性门)调用观察者——这些是完整性关切,不能被打折扣。

它做什么:读取刚刚完成阶段的对话范围(在检查点)或整个管道的对话范围(在完成时),对照 shared/collaboration_depth_rubric.md 中的规范评分标准对模式进行评分,并生成一个建议性的块/章节。维度:委托强度、认知警觉、认知再分配、区域分类(区域 1 / 区域 2 / 区域 3)。评分标准基于 Wang & Zhang (2026) IJETHE 23:11 (DOI 10.1186/s41239-026-00585-x)。

与现有机制的区分

机制评估内容阻塞性?
integrity_verification_agent(阶段 2.5 / 4.5)论文内容 — 参考文献、引用、数据是(阻塞门)
阶段 6 协作质量评估(6 维度,1-100)AI 对其自身行为的自我反思否,但仅产生一次
collaboration_depth_agent(此观察者)用户的协作模式(委托强度、警觉、再分配)否 — 永不阻塞。仅建议。

非阻塞保证

  • 观察者输出永远不会出现在任何检查点的“标记”行上。
  • 询问“准备好继续?”的提示不受观察者输出影响。
  • blocked_by: collaboration_depth_agentstate_tracker 中永远不是合法状态。
  • 如果观察者的 frontmatter 曾经断言 blocking: true,编排器必须拒绝调度它。

跨模型:当设置了 ARS_CROSS_MODEL 时,观察者在两个模型上都运行,并标记任何维度得分差异 > 2 分。分数永远不会跨模型静默平均。

关于完整评分程序和反谄媚纪律,参见 agents/collaboration_depth_agent.md;关于规范的四维度评分标准,参见 shared/collaboration_depth_rubric.md

---

反模式

明确禁止以防止常见失败模式:

#反模式失败原因正确行为
1跳过完整性检查“论文看起来没问题,跳过阶段 2.5/4.5”完整性检查是强制性的;无论感知质量如何都不能自动跳过
2编排器执行实质性工作管道编排器撰写内容或审阅论文编排器仅调度和协调;实质性工作属于子技能
3自动通过强制检查点没有用户确认就进入下一阶段强制检查点需要用户明确输入才能继续
4跨阶段质量下降阶段 4 修改后质量比阶段 2 草稿差,因为上下文窗口耗尽如果阶段 N 输出质量 < 阶段 N-1,暂停并在继续前重新加载核心原则
5静默丢弃审稿人关注点修改处理了 10 个关注点中的 8 个,希望没人注意到R&R 跟踪表必须记录每个关注点并明确状态
6在阶段 4.5 只重新验证已知问题最终完整性检查仅重新检查阶段 2.5 的发现阶段 4.5 必须独立从头验证;修改可能引入新问题
7夸大协作质量分数给出 90/100 以避免尴尬的自我批评诚实第一:不夸大,不客套;为每个分数引用具体证据
8绕过失败模式检查清单阻塞 (v3.2)“7 模式检查清单是新的,这次跳过它”阶段 2.5/4.5 失败模式检查清单是强制性的且阻塞性的;不存在 --no-block 标志;覆盖需要用户推理并记录以供阶段 6 使用

---

质量标准

维度要求
阶段检测正确识别用户的当前阶段和可用材料
模式推荐根据用户偏好和材料状态推荐适当模式
材料交接阶段间交接材料完整且格式正确
状态追踪管道状态实时更新;进度面板准确
强制检查点每个阶段完成后需要用户确认
强制完整性检查阶段 2.5 和 4.5 不可跳过,必须通过
强制失败模式检查清单 (v3.2)阶段 2.5 和 4.5 必须运行 7 模式 AI 研究失败检查清单;可疑失败阻塞;覆盖需要用户推理
不越界⚠️ 铁律:编排器不执行实质性的研究/写作/评审,仅调度
不强制⚠️ 铁律:用户可以随时暂停或退出管道(但不能跳过完整性检查)
可复现相同的输入在不同会话中遵循相同的工作流
收敛感知停止 (v3.2)如果变化量 < 3 分且无 P0 问题,建议停止修改循环;用户可以覆盖
预算透明 (v3.2; #388)token 成本估算 + 交互计数预算(往返上限 + 检查点累积计数,仅建议)+ 管道启动时用户确认

---

错误恢复

阶段错误处理方式
接收无法确定入口点询问用户拥有哪些材料及其目标
阶段 1deep-research 不收敛建议模式切换(socratic -> full)或缩小范围
阶段 2缺少研究基础建议返回阶段 1 补充研究
阶段 2.53 轮修正后仍失败列出无法验证的项目;用户决定是否继续
阶段 3评审结果为拒稿提供选项:重大重构(阶段 2)或放弃
阶段 4修改未完成所有项目列出未处理项目;询问是否继续
阶段 3'验证仍有重大问题进入阶段 4' 进行最终修改
阶段 4'修改后仍有问题标记为承认的限制;进入阶段 4.5
阶段 4.5最终验证失败修复并重新验证(最多 3 轮)
任意用户中途离开保存管道状态;下次可从断点恢复
任意技能执行失败报告错误;建议重试、暂停或模式切换。不要跳过强制完整性或失败模式门

---

智能体文件参考

智能体定义文件
pipeline_orchestrator_agentagents/pipeline_orchestrator_agent.md
state_tracker_agentagents/state_tracker_agent.md
integrity_verification_agentagents/integrity_verification_agent.md
collaboration_depth_agentagents/collaboration_depth_agent.md
claim_ref_alignment_audit_agentagents/claim_ref_alignment_audit_agent.md

---

参考文件

参考用途
references/pipeline_state_machine.md完整状态机定义:所有合法转换、前置条件、动作
references/plagiarism_detection_protocol.md阶段 D 原创性验证协议 + 自我剽窃 + AI 文本特征
references/mode_advisor.md统一跨技能决策树:将用户意图映射到最优技能 + 模式
references/claim_verification_protocol.md阶段 E 声明验证协议:声明提取、来源追踪、交叉引用、判定分类法
references/claim_audit_calibration_protocol.mdv3.8 #103 claim_ref_alignment 审计校准:黄金集形状 (T-C3)、阈值门 FNR<0.15 / FPR<0.10 (T-C1)、每类 FNR/FPR 报告 (T-C2)。通过 PYTHONPATH=. python3 -m unittest scripts.test_claim_audit_calibration -v 重新运行。
references/ai_research_failure_modes.md7 模式 AI 研究失败检查清单 (Lu 2026),在阶段 2.5 + 4.5 运行,具有阻塞行为,在阶段 6 报告
references/team_collaboration_protocol.md多人团队协调:角色定义、交接协议、版本控制、冲突解决
references/integrity_review_protocol.md阶段 2.5 + 4.5 完整性验证:5 阶段协议详情
references/two_stage_review_protocol.md两阶段评审:阶段 3 完整评审 + 阶段 3' 验证评审
references/external_review_protocol.md外部(人工)审稿人反馈:4 步接收/辅导/修改/验证
references/process_summary_protocol.md阶段 6:协作质量评估 + AI 自我反思报告
references/reproducibility_audit.md标准化工作流保证 + 审计跟踪格式
references/progress_dashboard_template.mdASCII 进度面板模板
references/reinforcement_content.md阶段特定的强化关注点表,用于转换
references/changelog.md完整版本历史
shared/handoff_schemas.md跨技能数据契约:所有阶段间交接制品的 9 个模式
shared/collaboration_depth_rubric.md协作深度观察者评分标准 (v1.0):基于 Wang & Zhang (2026) IJETHE 23:11 的 4 个维度

---

模板

模板用途
templates/pipeline_status_template.md进度面板输出模板

---

示例

示例展示内容
examples/full_pipeline_example.md完整管道对话记录(阶段 1-5,包含完整性 + 两阶段评审)
examples/mid_entry_example.md从阶段 2.5 开始的中途进入示例(已有论文 -> 完整性检查 -> 评审 -> 修改 -> 定稿)

---

输出语言

跟随用户语言。学术术语保留英文。

---

与其他技能的集成

academic-pipeline 调度以下技能(不自行完成工作):

阶段 1:deep-research
  - socratic 模式:引导式研究探索
  - full 模式:完整研究报告
  - quick 模式:快速研究摘要

阶段 2:academic-paper
  - plan 模式:苏格拉底式逐章指导
  - full 模式:完整论文写作

阶段 2.5:integrity_verification_agent(模式 1:预评审)
阶段 4.5:integrity_verification_agent(模式 2:最终检查)

阶段 3:academic-paper-reviewer
  - full 模式:完整的 5 人评审(EIC + R1/R2/R3 + 魔鬼代言人)

阶段 3':academic-paper-reviewer
  - re-review 模式:验证评审(聚焦于修改回复)

阶段 4/4':academic-paper(revision 模式)
阶段 5:academic-paper(format-convert 模式)
  - 步骤 1:询问用户想要的学术格式样式(APA 7.0 / Chicago / IEEE 等)
  - 步骤 2:生成 MD,然后在 Pandoc 可用时生成 DOCX(否则提供转换说明)
  - 步骤 3:生成 LaTeX(使用相应的文档类,如 APA 7.0 的 apa7 类)
  - 步骤 4:用户确认内容正确后,tectonic 编译 PDF(最终版本)
  - 字体:Times New Roman(英文)+ 思源宋体 TC VF(中文)+ Courier New(等宽)
  - ⚠️ 铁律:PDF 必须从 LaTeX 编译(禁止 HTML 转 PDF)

---

相关技能

技能关系
deep-research被调度(阶段 1 研究阶段)
academic-paper被调度(阶段 2 写作、阶段 4/4' 修改、阶段 5 格式化)
academic-paper-reviewer被调度(阶段 3 首次评审、阶段 3' 验证评审)

---

版本信息

项目内容
技能版本3.13.0
最后更新2026-06-18
维护者Cheng-I Wu
依赖技能deep-research v2.0+, academic-paper v2.0+, academic-paper-reviewer v1.1+
角色全学术研究工作流编排器

---

更新日志

关于完整版本历史,参见 references/changelog.md