Claude Code 102 教给学术研究者的五件事

Claude Code 102 教给学术研究者的五件事

2026 年 5 月 11 日,Mushtaq Bilal, PhD 发布了《Claude Code 102 for Academic Researchers》,这是他教程系列的第二篇。第一篇 Claude Code 101 在不到一周内获得了 430 万阅读,而这篇 102 在几个小时内也突破了 44 万。Bilal 的承诺非常直接:你不需要任何技术背景就能理解这些教程,如果你能用英语写句子,你就能用 Claude Code。这不是一句营销文案,它是整个教程的方法论基石——把 Agent 能力封装成学术研究者能够直观理解的操作模式。

Bilal 本人是一名学术写作教练,帮助过 6000 多名研究者提升学术写作效率,也是 ChatAcademia.com 的创始人。他写这套教程的出发点很清楚:AI Agent 在学术研究中的潜力巨大,但绝大多数研究者被技术门槛挡在了门外。他的 Claude Code 101 覆盖了最基础的启动流程——打开文件夹、添加 PDF、写一条 CLAUDE.md。而 102 则是在这个基础上,为长期、复杂的研究项目搭建了一套完整的方法论。以下是从这篇教程中提取的五件事,每一件都在回答同一个问题:当你的研究项目横跨数月甚至数年、涉及上百篇论文和多版草稿时,一个编码 Agent 还能帮上忙吗?

子文件夹即知识边界

Bilal 的第一个洞见关于项目组织。大多数人在开始使用 Claude Code 时,把所有文件塞进一个文件夹,写一条笼统的 CLAUDE.md 指令。这对短项目可行,但当你的项目变成包含文献、草稿、数据、会议记录和通信的多维结构时,一个大文件夹加一条指令的做法会迅速失效。Claude Code 无法区分不同上下文的诉求,给你的一百篇论文摘要和对你的第三章草稿的修改建议,会被同一套模糊的规则处理。

Bilal 的方案是子文件夹加嵌套 CLAUDE.md。在你的主项目文件夹下,创建 Literature、Chapters、Data、Notes、Correspondence 等子文件夹,每个子文件夹内放一条只针对该模块的 CLAUDE.md 指令。全局 CLAUDE.md 描述你是谁、项目是什么、学术规范是什么——它扮演宪法的角色。每个子文件夹的局部 CLAUDE.md 则像部门规章,只在该文件夹内生效。当你在 Chapters 文件夹里工作时,Claude Code 会同时读到宪法和部门规章,既可以理解全局上下文,也能执行精确到章节级别的指令。这个架构的巧妙之处在于:它不是技术方案,而是一个信息架构方案。任何做过长期研究的人都知道文件夹如何组织,Claude Code 只是把这个直觉映射成了 Agent 的上下文规则。

计划模式是低风险试探的护身符

Bilal 在教程中区分了两类任务:简单低风险的,和复杂高风险的。给 Literature 文件夹里的 PDF 批量重命名,属于前者,可以交给 Claude Code 直接执行。但从三十五篇论文的笔记中做综合综述,属于后者——一旦 Claude Code 错误理解了你的意图,你只能等它做完才发现。

Claude Code 的计划模式就是为这类场景设计的。它不是让 Agent 直接行动,而是先输出一个分步计划,你审核、修正、确认后再执行。Bilal 用一个类比解释了为什么这很重要:你不会对你的研究助理说「去把第三章写了」而不先问他的思路。计划模式的本质不是技术约束,而是沟通协议——让 Agent 在行动前先对齐人类的意图。对于需要三步以上、涉及多个子文件夹、或者会产生长文本输出的任务,永远先走计划模式,这是从 44 万阅读中沉淀出的第一条经验。

子代理让你的 Agent 拥有分身

教程中最有想象力的部分是子代理机制。Bilal 指出两个核心问题:上下文杂音和顺序依赖。当你在一个会话中让 Claude Code 读二十篇论文再起草一章内容,所有论文文本和你的所有对话都挤在同一个上下文窗口里。这是上下文杂音,会让后续输出变慢且失去精度。更糟糕的是,由于只有一个会话,你只能顺序执行任务——如果你需要三个不同的评审视角来评价你的草稿(一个理论家、一个信息学家、一个杠精审稿人),你无法并行执行,因为第一个评审的结果会影响第二个。

子代理的方案是一个独立会话。每个子代理有自己的上下文窗口和专用指令。它们不读取主项目的 CLAUDE.md,只按照自己 .md 文件中的指令行事。当你从主会话委托任务给子代理时,它的阅读和推理都留在子代理内部,主会话只收到最终结果。Bilal 给出了几个针对研究者的示例:文献阅读子代理负责结构化总结每一篇新论文,引用核查子代理逐一验证草稿中的引文,方法审计子代理检查实证部分的方法一致性,审稿人二号子代理用敌对视角审阅你的草稿。这些子代理可以并行运行:同时对同一章做理论审阅和方法审计,各自生成独立的评审报告,互不干扰,也不会污染主会话的上下文。

连接器让 Agent 走出文件夹

Claude Code 默认只能操作项目文件夹内的文件。但学术研究从来不是孤立的——引用在 Zotero 里,草稿在 Google Drive 里,会议记录在 Zoom 里。2024 年 Anthropic 推出 MCP 协议后,这些应用可以通过连接器与 Claude Code 打通。Bilal 的教程避开了所有技术细节,只告诉你两件事:去哪里点连接按钮,以及连接之后能做什么。

他的示例非常具体:把 Zoom 和 Claude Code 连接起来,输入「拉取我最近三次与同事的通话转录,提取所有与第四章相关的评论,保存到 Correspondence 文件夹」,Claude Code 就会跨应用执行——读取 Zoom 转录、提取相关内容、写入本地文件。连接器和子代理还可以组合使用:创建一个文献检索子代理,让它通过 PubMed 或 arXiv 连接器自动拉取最新论文。Bilal 在这里埋了一个重要的警告:不要连接包含未发表机密数据的应用。Agent 的便利性和数据安全是同一枚硬币的两面。

Hook 和定时任务是学术项目的保险丝

教程的最后一章关于备份和自动化。Bilal 的直觉是对的——学术研究中最容易被忽视的风险是文件丢失。一篇论文的前面几次写得很糟糕是正常的,但如果你没有保留每一个版本,你无法回到一个虽然粗糙但有价值的早期草稿。

Hook 是 Claude Code 的事件驱动机制:当某个事件发生(比如你要求编辑一个文件),Hook 自动触发一个动作(比如先复制一份备份)。Bilal 的示例是最实用的一个:创建一个「编辑前安全钩子」,在你要求 Claude Code 编辑任何章节之前,它先把当前版本复制到备份文件夹并加上时间戳。你永远不会失去任何一个版本的草稿。

定时任务则处理周期性工作:每周一早上九点通过 PubMed 拉取最新论文,交给文献审阅子代理筛选,把结果存到指定文件夹。Bilal 给出了一个克制性的原则:不要为你没有手动做过至少四次的任何事情设置自动化。这个原则值得所有 Agent 用户刻在桌子上——自动化不应该放大你的好想法,它同样会放大你的坏决定。

Bilal 的 102 教程和它的 101 一样,语言平实、步骤可操作。他并不试图让研究者成为 Claude Code 专家,而是给他们一套可以立刻上手的方法论。当一个有两百万用户的协作平台把 CLI 作为 Agent 的接口,当一个学术写作教练能用自然语言教会几十万人使用编码 Agent,这两个信号指向同一个方向:Agent 正在从技术人员的专属工具变成每个知识工作者的普通装备。

学术研究中使用 AI Agent 不再是一个技术问题——它是一个组织方法论问题。如果你能组织你的文件夹,你就能组织你的 Agent。

相关文章

Claude Code 2.1.136:当 AI Agent 的安全阈门从‘相信’变成‘验证’

Claude Code 2.1.136:当 AI Agent 的安全阈门从‘相信’变成‘验证’

你让 Claude Code 在 auto mode 下跑一个长任务,回来发现它把你的 AWS credentials 写进了日志文件。或者更糟:它在你没看到的一个弹窗里点了 "允许",然后把一个安全 ...

Agent 失败时:不会无限循环的恢复模式

Agent 的失败不抛异常。它们产出看起来合理但错误的输出,或者用稍微不同的方式悄悄重试同一个坏方法。把 Agent 包在 try/catch 里是错误的心智模型——Agent 没崩,它只是继续往一个 ...

没有标准答案的 Agent 怎么评测

评测一个 Prompt 已经很难。评测一个在给出答案前要跑十次工具调用的 Agent,是另一个量级的难。能产生正确答案的轨迹很少完全相同。能产生错误答案的轨迹常常一直看起来合理,直到第七步。标准的精确 ...

Agent 护栏:在不阉割 Agent 的前提下

给 Agent 加护栏属于那种简单版本太严苛、谨慎版本太宽松的任务。挡得太狠 Agent 拒绝完全合理的任务;挡得太松,新闻头条自己就写出来了。第一版要么是什么都不肯做的聊天机器人,要么是不该做那件事 ...

Agent Harness:为什么你的模型不是问题所在

LangChain 在 TerminalBench 2.0 上从 30 名开外飙到了第 5 名。他们没有换模型。同一个 LLM。同样的参数。唯一改变的是包裹在模型外面的那层软件——Harness。 ...

Planner-Executor 拆分:什么时候该拆,什么时候该合

第一天,让单个模型同时做规划和执行,看起来很优雅。三个月后,trace 日志会讲一个不同的故事:Prompt 里负责规划的那部分在工具调用上下文中开始漂移,负责执行的那部分开始幻觉出从未被规划过的步骤 ...

Postiz Agent CLI:把 28 个社交平台的发布权交给你的 AI

你写了一个能读 RSS、能总结论文、能生成配图的 AI Agent,结果发现最后一英里卡住了:它没法把内容发出去。 不是技术问题,是生态断层。大多数社交媒体平台只给人类设计 UI,API 文档散落在 ...

用经典编程规则喂饱你的 AI 编码 Agent

用经典编程规则喂饱你的 AI 编码 Agent

AI Coding Agent 写代码的速度远超人类,但它们不天然知道什么代码算是好代码。没有明确约束,Agent 产出的代码在 demo 里看起来功能完整,三个月后在维护追索里看起来一团乱——函数过 ...

工具选择:什么时候该模型挑,什么时候该你挑

会用工具的 Agent 在 demo 里看起来很有力,因为模型在选下一步做什么。它在生产里看起来很脆弱,因为模型在选下一步做什么。可用工具的空间随特性线性增长,随边界情况二次增长——超过大约十二个工具 ...

Dexter:为金融研究而生的自主 Agent

Dexter:为金融研究而生的自主 Agent

金融研究是一个天然适合 AI Agent 的领域——数据公开、步骤可结构化、输出是分析而非行动。但多数通用 Agent 在这个场景里会暴露两个问题:碰到的数据格式太多太杂,每步都要重新理解上下文;缺少 ...

文件驱动的 Agent,不需要构建步骤

周五晚上还在排 pitch deck 格式的投行分析师,并没有在创造 alpha。他们在给数字画框——那些数字早就从 CapIQ 拉出来了,早就在模型里交叉验证过了,早就被 VP 批过了。横在数据和格 ...

OpenClaw 终于长出手和眼:Peekaboo v3

OpenClaw 终于长出手和眼:Peekaboo v3

OpenClaw 之前能接消息、能调 Agent、能把结果送到各个聊天渠道,但缺一双手和眼睛。Agent 在聊天框里给建议容易,要它实际操作桌面上的按钮、菜单、弹窗、输入框,之前没有可靠的本地执行层。 ...

Claude Code 之父:编程已死,loop 永生

Claude Code 之父:编程已死,loop 永生

一个人,一天提交 150 个 PR,全部用手机完成,一行代码都没亲手写。这个人是 Boris Cherny,Claude Code 的创造者。他在 Sequoia AI Ascent 2026 上聊了 ...