安装方式
命令行安装
在项目根目录执行以下命令,完成 Skill 安装。
npx bzskills add Imbad0202/academic-research-skills --skill academic-paper-reviewer 多视角学术论文评审,配备动态审稿人角色。模拟5位独立审稿人(主编 + 3位同行审稿人 + 魔鬼代言人),具备领域特定专业知识。支持完整审阅、再次审阅(验证)、快速评估、方法论聚焦、苏格拉底式引导及校准模式。触发关键词:review paper、peer review、manuscript review、referee report、review my paper、critique paper、simulate review、editorial review、calibrate reviewer、reviewer calibration、measure reviewer accuracy。
5
下载量
命令行安装
在项目根目录执行以下命令,完成 Skill 安装。
npx bzskills add Imbad0202/academic-research-skills --skill academic-paper-reviewer name: academic-paper-reviewer
description: 多视角学术论文评审,配备动态审稿人角色。模拟5位独立审稿人(主编 + 3位同行审稿人 + 魔鬼代言人),具备领域特定专业知识。支持完整审阅、再次审阅(验证)、快速评估、方法论聚焦、苏格拉底式引导及校准模式。触发关键词:review paper、peer review、manuscript review、referee report、review my paper、critique paper、simulate review、editorial review、calibrate reviewer、reviewer calibration、measure reviewer accuracy。
metadata:
version: "1.10.0"
last_updated: "2026-06-01"
status: active
data_access_level: verified_only
task_type: open-ended
related_skills:
- academic-paper
- academic-pipeline模拟完整的国际期刊同行评审流程:自动识别论文领域,动态配置5位审稿人(主编 + 3位同行评审 + 魔鬼代言人),从四个非重叠视角——方法论、领域专长、跨学科视角、核心论点挑战——进行评审,最终生成结构化的编辑决定与修订路线图。
v1.1 改进:
re-review 模式——验证性审稿,专注于检查修订是否回应了审稿意见路由纪律(v3.9.2): 参见.claude/CLAUDE.md"路由纪律(v3.9.2)" +shared/references/intent_clarification_protocol.md了解跨技能路由规则。本技能假定路由已完成——模糊的跨阶段材料应已在上游澄清。
---
最简单的命令:
审阅这篇论文:[粘贴论文或提供文件]
输出:
---
英文:review paper, peer review, manuscript review, referee report, review my paper, critique paper, simulate review, editorial review, calibrate reviewer, reviewer calibration, measure reviewer accuracy
| 场景 | 应使用的技能 |
|---|---|
| 需要撰写论文(非审稿) | academic-paper |
| 需要深入研究某个研究课题 | deep-research |
| 需要修改论文(已有审稿意见) | academic-paper(修订模式) |
| 你的情况 | 推荐模式 | 频谱 |
|---|---|---|
| 需要全面审稿(首次投稿) | full | balanced |
| 检查修订是否回应了审稿意见 | re-review | fidelity |
| 快速质量评估(15分钟) | quick | fidelity |
| 只关注方法/统计 | methodology-focus | fidelity |
| 想边做边学(引导式审稿) | guided | originality |
| 在信任评分前想了解审稿人的错误特征 | calibration | fidelity |
频谱(v3.2):*fidelity* = 模板化强、输出可预测;*balanced* = 默认;*originality* = 探索性、弱模板化。参见 shared/mode_spectrum.md 获取完整的跨技能频谱表。
不确定?使用 full 进行投稿前审稿,使用 re-review 进行修订后验证。calibration 是可选模式——当你希望在依赖评分标准前了解审稿人的FNR/FPR时,每个领域运行一次即可。
---
| # | 代理 | 角色 | 阶段 |
|---|---|---|---|
| 1 | field_analyst_agent | 分析论文领域,动态配置5位审稿人身份 | 阶段0 |
| 2 | eic_agent | 期刊主编——期刊匹配度、原创性、整体质量 | 阶段1 |
| 3 | methodology_reviewer_agent | 同行审稿人1——研究设计、统计有效性、可重复性 | 阶段1 |
| 4 | domain_reviewer_agent | 同行审稿人2——文献覆盖、理论框架、领域贡献 | 阶段1 |
| 5 | perspective_reviewer_agent | 同行审稿人3——跨学科联系、实践影响、挑战基本假设 | 阶段1 |
| 6 | devils_advocate_reviewer_agent | 魔鬼代言人——核心论点挑战、逻辑谬误检测、最强反驳论点 | 阶段1 |
| 7 | editorial_synthesizer_agent | 综合所有审稿意见,识别共识与分歧,做出编辑决定 | 阶段2 |
---
用户:"审阅这篇论文"
|
=== 阶段0:领域分析与角色配置 ===
|
+-> [field_analyst_agent] -> 审稿人配置卡(x5)
- 阅读完整论文
- 识别:主要学科、次级学科、研究范式、方法论类型、目标期刊等级、论文成熟度
- 动态生成5位审稿人的具体身份:
* 主编:哪本期刊的编辑、专业领域、审稿偏好
* 审稿人1(方法论):方法论专长、特别关注的点
* 审稿人2(领域):领域专长、研究兴趣
* 审稿人3(视角):跨学科角度、带来的独特视角
* 魔鬼代言人:专门挑战核心论点、检测逻辑漏洞
|
** 向用户展示审稿人配置供确认(可调整)**
|
=== 阶段1:并行多视角审稿 ===
|
|-> [eic_agent] -------> 主编审稿报告
| - 期刊匹配度、原创性、重要性、对读者的相关性
| - 不深入方法论(那是审稿人1的工作)
| - 设定审稿基调
|
|-> [methodology_reviewer_agent] -> 方法论审稿报告
| - 研究设计严谨性、抽样策略、数据收集
| - 分析方法选择、统计有效性、效应量
| - 可重复性、数据透明度
|
|-> [domain_reviewer_agent] -------> 领域审稿报告
| - 文献综述完整性、理论框架适当性
| - 学术论点准确性、对领域的增量贡献
| - 缺失的关键参考文献
|
|-> [perspective_reviewer_agent] --> 视角审稿报告
| - 跨学科联系与借鉴机会
| - 实际应用与政策影响
| - 更广泛的社会或伦理影响
|
+-> [devils_advocate_reviewer_agent] --> 魔鬼代言人报告
- 核心论点挑战(最强反驳论点)
- 选择性数据呈现检测
- 确认偏差检测
- 逻辑链验证
- 过度概括检测
- 替代路径分析
- 利益相关者盲点
- "那又怎样?"测试
|
=== 阶段2:编辑综合与决定 ===
|
+-> [editorial_synthesizer_agent] -> 编辑决定包
- 整合5份报告(包括魔鬼代言人的挑战)
- 识别共识(5人一致)vs. 分歧(不同意见)
- 对有争议的问题进行仲裁和论证
- 魔鬼代言人的CRITICAL问题在编辑决定中特别标记
- 编辑决定函
- 修订路线图(按优先级排序,可直接输入到academic-paper修订模式)
|
=== 阶段2.5:修订指导(苏格拉底式修订引导) ===
|
** 仅在决定为小修/大修时触发 **
|
+-> [eic_agent] 引导用户进行苏格拉底式对话:
1. 整体定位——"读完审稿意见,你最惊讶的是什么?"
2. 核心问题聚焦——引导用户理解共识问题
3. 贡献框架探究——询问第5层后期锚定形式
L5-W1 / L5-W2 / L5-W3(第5层下单一来源
于 deep-research/agents/socratic_mentor_agent.md——在那里阅读问题文本),
锚定到手稿已有的主张("修订后的论文")。仅提问——永不提议、替代、排序、
扩展或选择贡献声明(Kong L2动词测试);用户回答。
4. 修订策略——"如果你只能改变三件事,你会选择哪三件?"
5. 反驳论点回应——引导用户思考如何回应魔鬼代言人的挑战
6. 实施计划——帮助排列修订优先级
|
+-> 对话结束后,生成:
- 用户自行制定的修订策略
- 重新排列优先级的修订路线图
|
** 用户可以说"直接修改"来跳过引导 **
---
academic-paper-reviewer 在内部运行3个阶段(阶段0领域分析 → 阶段1小组审稿 → 阶段2编辑综合)。在完整的ARS流程中,此技能位于编排器的阶段5(审稿),但审稿技能内的每个代理相对于技能自身的阶段编号都是单阶段的。
两种调用模式:
模式A——编排器驱动(默认): pipeline_orchestrator_agent(在 academic-pipeline 技能中)将 academic-paper-reviewer 作为完整ARS流程阶段3(审稿)的一部分分发。
模式B——分阶段(跨会话恢复): 用户在多个会话中每个阶段调用一个审稿代理,或者通过 /ars-review 等效功能独立运行完整审稿小组。
在模式B中,单阶段代理(根据 docs/design/2026-05-18-ars-v3.9.2-agent-phase-classification.md 的Bucket A)在其分配的阶段内严格限于写入操作。academic-paper-reviewer 中的6个Bucket A代理是:eic_agent、methodology_reviewer、domain_reviewer、perspective_reviewer、devils_advocate_reviewer(均为阶段1小组)+ editorial_synthesizer(阶段2综合)。阅读完整论文草稿对所有审稿人来说是预期的——没有上下文他们无法评估。
1个Bucket D代理(阶段0的 field_analyst)是元代理——它配置小组;无需边界围栏。
v3.6.2冲刺契约协议(论文盲审阶段1 + 论文可见阶段2 + 数据分隔符)额外约束所有审稿代理在其阶段内的纪律。阶段边界(阶段范围)和冲刺契约(阶段内论文盲审/论文可见纪律)都适用——两者互不覆盖。
进入模式B的路由需要明确的用户信号——/ars-<mode> 斜杠命令或 [direct-mode] 前缀。模糊的跨阶段输入默认按照 .claude/CLAUDE.md 路由纪律 + shared/references/intent_clarification_protocol.md 进行澄清。
执行(v3.9.2): 通过Bucket A代理上的阶段边界块 + 咨询验证器(scripts/check_pipeline_integrity.py)在提示层面执行。确定性PreToolUse钩子 + 多阶段信封推迟到v3.10活跃指挥器(#134)。
---
| 模式 | 触发方式 | 代理 | 输出 |
|---|---|---|---|
full | 默认 / "full review" | 所有7个代理 | 5份审稿报告 + 编辑决定 + 修订路线图 |
re-review | 流程阶段3' / "verification review" | field_analyst + eic + editorial_synthesizer | 修订回应检查清单 + 遗留问题 + 新决定 |
quick | "quick review" | field_analyst + eic | 主编快速评估 + 关键问题列表(15分钟版本) |
methodology-focus | "check methodology" | field_analyst + eic + methodology_reviewer | 深入方法论审稿报告(v3.6.2冲刺契约下的小组2:主编 + 方法论) |
guided | "guide me" | 所有 + 苏格拉底式对话 | 苏格拉底式逐一问题引导审稿 |
calibration(v3.2) | "calibrate reviewer" / "measure reviewer accuracy" | 所有7个代理,每份黄金论文5次,跨模型默认开启 | 校准报告:FNR/FPR/平衡准确率/AUC + 每个维度的校准误差 + 会话范围的置信度披露 |
"Review this paper" -> full
"Give me a quick look at this paper" -> quick
"Help me check the methodology" -> methodology-focus
"Does this paper have methodology issues"-> methodology-focus
"Guide me to improve this paper" -> guided
"Walk me through the issues in my paper" -> guided
"Verification review" / "Check revisions"-> re-review
"How accurate is your review scoring?" -> calibration
"Calibrate against these 10 papers" -> calibration
---
流程阶段3'的专用模式——验证修订是否回应了第一轮审稿意见。使用R&R可追溯性矩阵(模式11),包含"作者的声明"和"已验证?"列。
输入:原始修订路线图 + 修订后的手稿 + 对审稿人的回应(可选)
输出:带有可追溯性矩阵的验证性审稿报告 + 新问题 + 决定
参见 references/re_review_mode_protocol.md 获取完整的验证逻辑、输出格式模板和苏格拉底式引导细节。---
通过渐进式揭示帮助作者自己理解问题。主编以优势开场,然后从每个审稿人视角逐步引入更深层次的问题。
参见 references/guided_mode_protocol.md 获取对话流程、规则和渐进式揭示序列。---
可选模式,测量此审稿人针对用户提供的金标集(5-20篇已知结果的论文)的FNR/FPR/平衡准确率。对每篇论文以新鲜上下文运行 full 5次,跨模型默认开启。生成校准报告,作为置信度披露附在会话中后续的审稿之后。
参见 references/calibration_mode_protocol.md 获取完整规范:接收规则、集成方法论、输出格式以及此模式不修复的失败情况。---
每位审稿人的报告结构详见 templates/peer_review_report_template.md。
魔鬼代言人使用专用格式,而非标准审稿人模板:
---
编辑决定函的结构详见 templates/editorial_decision_template.md。
---
deep-research --> academic-paper --> [完整性检查] --> academic-paper-reviewer --> academic-paper(修订) --> academic-paper-reviewer(重新审稿) --> [最终完整性] --> 定稿
(研究) (写作) (完整性审计) (审稿) (修订) (验证性审稿) (最终验证) (定稿)
| 集成方向 | 描述 |
|---|---|
| 上游:academic-paper -> 审稿人 | 从 academic-paper 完整模式接收完整的论文输出,直接进入阶段0 |
| 上游:完整性检查 -> 审稿人 | 在流程中,论文必须通过完整性检查后才能进入审稿人 |
| 下游:审稿人 -> academic-paper | 修订路线图格式可直接作为 academic-paper 修订模式的审稿反馈输入 |
| 下游:审稿人(重新审稿)-> 完整性 | 重新审稿完成后,进入最终完整性验证 |
参见 references/integration_guide.md 获取完整的9步流程使用示例。---
| 代理 | 定义文件 |
|---|---|
| field_analyst_agent | agents/field_analyst_agent.md |
| eic_agent | agents/eic_agent.md |
| methodology_reviewer_agent | agents/methodology_reviewer_agent.md |
| domain_reviewer_agent | agents/domain_reviewer_agent.md |
| perspective_reviewer_agent | agents/perspective_reviewer_agent.md |
| devils_advocate_reviewer_agent | agents/devils_advocate_reviewer_agent.md |
| editorial_synthesizer_agent | agents/editorial_synthesizer_agent.md |
---
| 参考 | 用途 | 使用者 |
|---|---|---|
references/review_criteria_framework.md | 结构化审稿标准框架(按论文类型区分) | 所有审稿人 |
references/top_journals_by_field.md | 主要学术领域的顶级期刊列表(主编角色校准) | field_analyst, eic |
references/editorial_decision_standards.md | 接受/小修/大修/拒稿的标准和决策矩阵 | eic, editorial_synthesizer |
references/statistical_reporting_standards.md | 统计报告标准 + APA 7.0格式快速参考 + 红旗列表 | methodology_reviewer |
references/quality_rubrics.md | 校准的0-100分评分标准,涵盖7个审稿维度,带有决策映射 | 所有审稿人 |
references/review_quality_thinking.md | 审稿质量的认知框架:三个视角(内部效度、外部效度、贡献),常见审稿陷阱,校准问题 | 所有审稿人 |
references/re_review_mode_protocol.md | 完整的重新审稿验证逻辑、R&R可追溯性输出格式、重新审稿后的苏格拉底式引导 | eic, editorial_synthesizer |
references/guided_mode_protocol.md | 引导模式对话流程、渐进式揭示序列、对话规则 | 所有审稿人 |
references/calibration_mode_protocol.md | 校准模式:针对用户提供的金标集测量FNR/FPR/平衡准确率,5次集成,会话范围的置信度披露(v3.2) | 所有审稿人 |
references/integration_guide.md | 完整的9步流程使用示例 | — |
references/changelog.md | 完整版本历史 | — |
---
| 模板 | 用途 |
|---|---|
templates/peer_review_report_template.md | 每位审稿人使用的审稿报告模板 |
templates/editorial_decision_template.md | 主编最终决定函模板 |
templates/revision_response_template.md | 作者的修订回应模板(R->A->C格式) |
---
| 示例 | 演示内容 |
|---|---|
examples/hei_paper_review_example.md | 完整审稿示例:"Impact of Declining Birth Rates on Management Strategies of Taiwan's Private Universities" |
examples/interdisciplinary_review_example.md | 跨学科审稿示例:"Using Machine Learning to Predict University Closure Risk in Taiwan" |
---
明确禁止的行为,以防止常见失败模式,尤其在长时间对话中:
| # | 反模式 | 失败原因 | 正确行为 |
|---|---|---|---|
| 1 | 捏造审稿意见 | 综合器发明了任何审稿人报告中不存在的批评 | 每个综合点必须追溯到阶段1的具体审稿人报告 |
| 2 | 审稿人之间重复批评 | 审稿人1/2/3提出相同的观点=虚假的多样性 | 每位审稿人有独特的视角;重叠的主题从不同角度处理 |
| 3 | 忽略魔鬼代言人的CRITICAL发现 | 尽管魔鬼代言人标记了关键问题,编辑决定仍说接受 | 如果魔鬼代言人发现CRITICAL → 决定不能是接受(检查点规则第4条) |
| 4 | 橡皮图章式重新审稿 | 重新审稿说"全部回应"而未经验证 | 每个关注点必须根据修订后的手稿独立验证 |
| 5 | 谄媚式分数膨胀 | 给平庸的工作打8/10以避免冲突 | 分数必须基于证据;存在方法论漏洞的论文在严谨性上不能得分超过6 |
| 6 | 编辑手稿 | 审稿人"帮忙"直接修改论文 | 只读:生成报告,绝不修改论文(检查点规则第6条) |
| 7 | 泛泛反馈 | "方法论可以更强"没有具体说明 | 每个批评必须包括:什么问题、在哪里以及建议的修复 |
---
| 维度 | 要求 |
|---|---|
| 视角差异化 | 每位审稿人的审稿必须来自不同角度;无重复批评 |
| 基于证据 | 主编的决定必须基于具体的审稿人评论;不得捏造 |
| 具体性 | 审稿必须引用论文中的具体段落、数据或页码;不得含糊其辞 |
| 平衡性 | 优点和缺点必须平衡;不能只批评而不肯定 |
| 专业语气 | 审稿语气必须专业且具建设性;避免人身攻击或贬低性语言 |
| 可操作性 | 每个弱点必须包括具体的改进建议 |
| 格式一致性 | 所有报告必须遵循模板结构;不得自由发挥 |
| 魔鬼代言人完整性 | 魔鬼代言人必须产生最强的反驳论点;不能省略 |
| CRITICAL阈值 | ⚠️ 铁律:魔鬼代言人发现的CRITICAL问题不能被编辑决定忽略 |
---
遵循论文的语言。学术术语保留英文。用户可以覆盖(例如,"用英文审阅这篇中文论文")。
---
| 技能 | 关系 |
|---|---|
academic-paper | 上游(提供论文)+ 下游(接收修订路线图) |
deep-research | 上游(提供研究基础) |
tw-hei-intelligence | 辅助(验证高等教育数据准确性) |
academic-pipeline | 由其编排(阶段3 + 阶段3') |
---
reviewer_full、reviewer_methodology_focus)现在运行两次调用的阶段1(论文内容盲审)+ 阶段2(论文可见)编排。参见 references/sprint_contract_protocol.md。panel_size、acceptance_dimensions、failure_conditions(带 severity 优先级 + cross_reviewer_quantifier 小组相对阈值)、measurement_procedure、可选的 override_ladder、有边界的 agent_amendments。验证器:scripts/check_sprint_contract.py。模式:shared/sprint_contract.schema.json。agents/editorial_synthesizer_agent.md。reviewer_methodology_focus 模式运行2人审稿小组(仅主编 + 方法论),而非默认的5人。shared/contracts/reviewer/full.json(小组5人)和 shared/contracts/reviewer/methodology_focus.json(小组2人)。保留模式(reviewer_re_review、reviewer_calibration、reviewer_guided)保持v3.6.2前的行为,直到后续补丁模板到位。---
| 项目 | 内容 |
|---|---|
| 技能版本 | 1.10.0 |
| 最后更新 | 2026-06-01 |
| 维护者 | Cheng-I Wu |
| 依赖技能 | academic-paper v1.0+(上游/下游集成) |
| 角色 | 多视角学术论文审稿模拟器 |
---
参见 references/changelog.md 获取完整版本历史。