Claude Code 102 教给学术研究者的五件事

John Doe
工具 , Agent
13 May, 2026

2026 年 5 月 11 日，Mushtaq Bilal, PhD 发布了《Claude Code 102 for Academic Researchers》，这是他教程系列的第二篇。第一篇 Claude Code 101 在不到一周内获得了 430 万阅读，而这篇 102 在几个小时内也突破了 44 万。Bilal 的承诺非常直接：你不需要任何技术背景就能理解这些教程，如果你能用英语写句子，你就能用 Claude Code。这不是一句营销文案，它是整个教程的方法论基石——把 Agent 能力封装成学术研究者能够直观理解的操作模式。

Bilal 本人是一名学术写作教练，帮助过 6000 多名研究者提升学术写作效率，也是 ChatAcademia.com 的创始人。他写这套教程的出发点很清楚：AI Agent 在学术研究中的潜力巨大，但绝大多数研究者被技术门槛挡在了门外。他的 Claude Code 101 覆盖了最基础的启动流程——打开文件夹、添加 PDF、写一条 CLAUDE.md。而 102 则是在这个基础上，为长期、复杂的研究项目搭建了一套完整的方法论。以下是从这篇教程中提取的五件事，每一件都在回答同一个问题：当你的研究项目横跨数月甚至数年、涉及上百篇论文和多版草稿时，一个编码 Agent 还能帮上忙吗？

子文件夹即知识边界

Bilal 的第一个洞见关于项目组织。大多数人在开始使用 Claude Code 时，把所有文件塞进一个文件夹，写一条笼统的 CLAUDE.md 指令。这对短项目可行，但当你的项目变成包含文献、草稿、数据、会议记录和通信的多维结构时，一个大文件夹加一条指令的做法会迅速失效。Claude Code 无法区分不同上下文的诉求，给你的一百篇论文摘要和对你的第三章草稿的修改建议，会被同一套模糊的规则处理。

Bilal 的方案是子文件夹加嵌套 CLAUDE.md。在你的主项目文件夹下，创建 Literature、Chapters、Data、Notes、Correspondence 等子文件夹，每个子文件夹内放一条只针对该模块的 CLAUDE.md 指令。全局 CLAUDE.md 描述你是谁、项目是什么、学术规范是什么——它扮演宪法的角色。每个子文件夹的局部 CLAUDE.md 则像部门规章，只在该文件夹内生效。当你在 Chapters 文件夹里工作时，Claude Code 会同时读到宪法和部门规章，既可以理解全局上下文，也能执行精确到章节级别的指令。这个架构的巧妙之处在于：它不是技术方案，而是一个信息架构方案。任何做过长期研究的人都知道文件夹如何组织，Claude Code 只是把这个直觉映射成了 Agent 的上下文规则。

计划模式是低风险试探的护身符

Bilal 在教程中区分了两类任务：简单低风险的，和复杂高风险的。给 Literature 文件夹里的 PDF 批量重命名，属于前者，可以交给 Claude Code 直接执行。但从三十五篇论文的笔记中做综合综述，属于后者——一旦 Claude Code 错误理解了你的意图，你只能等它做完才发现。

Claude Code 的计划模式就是为这类场景设计的。它不是让 Agent 直接行动，而是先输出一个分步计划，你审核、修正、确认后再执行。Bilal 用一个类比解释了为什么这很重要：你不会对你的研究助理说「去把第三章写了」而不先问他的思路。计划模式的本质不是技术约束，而是沟通协议——让 Agent 在行动前先对齐人类的意图。对于需要三步以上、涉及多个子文件夹、或者会产生长文本输出的任务，永远先走计划模式，这是从 44 万阅读中沉淀出的第一条经验。

子代理让你的 Agent 拥有分身

教程中最有想象力的部分是子代理机制。Bilal 指出两个核心问题：上下文杂音和顺序依赖。当你在一个会话中让 Claude Code 读二十篇论文再起草一章内容，所有论文文本和你的所有对话都挤在同一个上下文窗口里。这是上下文杂音，会让后续输出变慢且失去精度。更糟糕的是，由于只有一个会话，你只能顺序执行任务——如果你需要三个不同的评审视角来评价你的草稿（一个理论家、一个信息学家、一个杠精审稿人），你无法并行执行，因为第一个评审的结果会影响第二个。

子代理的方案是一个独立会话。每个子代理有自己的上下文窗口和专用指令。它们不读取主项目的 CLAUDE.md，只按照自己 .md 文件中的指令行事。当你从主会话委托任务给子代理时，它的阅读和推理都留在子代理内部，主会话只收到最终结果。Bilal 给出了几个针对研究者的示例：文献阅读子代理负责结构化总结每一篇新论文，引用核查子代理逐一验证草稿中的引文，方法审计子代理检查实证部分的方法一致性，审稿人二号子代理用敌对视角审阅你的草稿。这些子代理可以并行运行：同时对同一章做理论审阅和方法审计，各自生成独立的评审报告，互不干扰，也不会污染主会话的上下文。

连接器让 Agent 走出文件夹

Claude Code 默认只能操作项目文件夹内的文件。但学术研究从来不是孤立的——引用在 Zotero 里，草稿在 Google Drive 里，会议记录在 Zoom 里。2024 年 Anthropic 推出 MCP 协议后，这些应用可以通过连接器与 Claude Code 打通。Bilal 的教程避开了所有技术细节，只告诉你两件事：去哪里点连接按钮，以及连接之后能做什么。

他的示例非常具体：把 Zoom 和 Claude Code 连接起来，输入「拉取我最近三次与同事的通话转录，提取所有与第四章相关的评论，保存到 Correspondence 文件夹」，Claude Code 就会跨应用执行——读取 Zoom 转录、提取相关内容、写入本地文件。连接器和子代理还可以组合使用：创建一个文献检索子代理，让它通过 PubMed 或 arXiv 连接器自动拉取最新论文。Bilal 在这里埋了一个重要的警告：不要连接包含未发表机密数据的应用。Agent 的便利性和数据安全是同一枚硬币的两面。

Hook 和定时任务是学术项目的保险丝

教程的最后一章关于备份和自动化。Bilal 的直觉是对的——学术研究中最容易被忽视的风险是文件丢失。一篇论文的前面几次写得很糟糕是正常的，但如果你没有保留每一个版本，你无法回到一个虽然粗糙但有价值的早期草稿。

Hook 是 Claude Code 的事件驱动机制：当某个事件发生（比如你要求编辑一个文件），Hook 自动触发一个动作（比如先复制一份备份）。Bilal 的示例是最实用的一个：创建一个「编辑前安全钩子」，在你要求 Claude Code 编辑任何章节之前，它先把当前版本复制到备份文件夹并加上时间戳。你永远不会失去任何一个版本的草稿。

定时任务则处理周期性工作：每周一早上九点通过 PubMed 拉取最新论文，交给文献审阅子代理筛选，把结果存到指定文件夹。Bilal 给出了一个克制性的原则：不要为你没有手动做过至少四次的任何事情设置自动化。这个原则值得所有 Agent 用户刻在桌子上——自动化不应该放大你的好想法，它同样会放大你的坏决定。

Bilal 的 102 教程和它的 101 一样，语言平实、步骤可操作。他并不试图让研究者成为 Claude Code 专家，而是给他们一套可以立刻上手的方法论。当一个有两百万用户的协作平台把 CLI 作为 Agent 的接口，当一个学术写作教练能用自然语言教会几十万人使用编码 Agent，这两个信号指向同一个方向：Agent 正在从技术人员的专属工具变成每个知识工作者的普通装备。

学术研究中使用 AI Agent 不再是一个技术问题——它是一个组织方法论问题。如果你能组织你的文件夹，你就能组织你的 Agent。

Claude Code 2.1.136：当 AI Agent 的安全阈门从‘相信’变成‘验证’

John Doe
安全 , Agent
09 May, 2026

你让 Claude Code 在 auto mode 下跑一个长任务，回来发现它把你的 AWS credentials 写进了日志文件。或者更糟：它在你没看到的一个弹窗里点了 "允许"，然后把一个安全 ...

Agent 失败时：不会无限循环的恢复模式

Agent 的失败不抛异常。它们产出看起来合理但错误的输出，或者用稍微不同的方式悄悄重试同一个坏方法。把 Agent 包在 try/catch 里是错误的心智模型——Agent 没崩，它只是继续往一个 ...

没有标准答案的 Agent 怎么评测

评测一个 Prompt 已经很难。评测一个在给出答案前要跑十次工具调用的 Agent，是另一个量级的难。能产生正确答案的轨迹很少完全相同。能产生错误答案的轨迹常常一直看起来合理，直到第七步。标准的精确 ...

Agent 护栏：在不阉割 Agent 的前提下

给 Agent 加护栏属于那种简单版本太严苛、谨慎版本太宽松的任务。挡得太狠 Agent 拒绝完全合理的任务；挡得太松，新闻头条自己就写出来了。第一版要么是什么都不肯做的聊天机器人，要么是不该做那件事 ...

Agent Harness：为什么你的模型不是问题所在

LangChain 在 TerminalBench 2.0 上从 30 名开外飙到了第 5 名。他们没有换模型。同一个 LLM。同样的参数。唯一改变的是包裹在模型外面的那层软件——Harness。 ...

Planner-Executor 拆分：什么时候该拆，什么时候该合

Sam Wilson
架构 , Agent
03 May, 2026

第一天，让单个模型同时做规划和执行，看起来很优雅。三个月后，trace 日志会讲一个不同的故事：Prompt 里负责规划的那部分在工具调用上下文中开始漂移，负责执行的那部分开始幻觉出从未被规划过的步骤 ...

Postiz Agent CLI：把 28 个社交平台的发布权交给你的 AI

John Doe
工具 , Agent
09 May, 2026

你写了一个能读 RSS、能总结论文、能生成配图的 AI Agent，结果发现最后一英里卡住了：它没法把内容发出去。不是技术问题，是生态断层。大多数社交媒体平台只给人类设计 UI，API 文档散落在 ...

用经典编程规则喂饱你的 AI 编码 Agent

John Doe
Tooling , Agent
07 May, 2026

AI Coding Agent 写代码的速度远超人类，但它们不天然知道什么代码算是好代码。没有明确约束，Agent 产出的代码在 demo 里看起来功能完整，三个月后在维护追索里看起来一团乱——函数过 ...

工具选择：什么时候该模型挑，什么时候该你挑

会用工具的 Agent 在 demo 里看起来很有力，因为模型在选下一步做什么。它在生产里看起来很脆弱，因为模型在选下一步做什么。可用工具的空间随特性线性增长，随边界情况二次增长——超过大约十二个工具 ...

Dexter：为金融研究而生的自主 Agent

John Doe
Agent , 金融
07 May, 2026

金融研究是一个天然适合 AI Agent 的领域——数据公开、步骤可结构化、输出是分析而非行动。但多数通用 Agent 在这个场景里会暴露两个问题：碰到的数据格式太多太杂，每步都要重新理解上下文；缺少 ...

文件驱动的 Agent，不需要构建步骤

周五晚上还在排 pitch deck 格式的投行分析师，并没有在创造 alpha。他们在给数字画框——那些数字早就从 CapIQ 拉出来了，早就在模型里交叉验证过了，早就被 VP 批过了。横在数据和格 ...

OpenClaw 终于长出手和眼：Peekaboo v3

John Doe
Agent , 工具
11 May, 2026

OpenClaw 之前能接消息、能调 Agent、能把结果送到各个聊天渠道，但缺一双手和眼睛。Agent 在聊天框里给建议容易，要它实际操作桌面上的按钮、菜单、弹窗、输入框，之前没有可靠的本地执行层。 ...

Claude Code 之父：编程已死，loop 永生

一个人，一天提交 150 个 PR，全部用手机完成，一行代码都没亲手写。这个人是 Boris Cherny，Claude Code 的创造者。他在 Sequoia AI Ascent 2026 上聊了 ...