文件驱动的 Agent,不需要构建步骤

周五晚上还在排 pitch deck 格式的投行分析师,并没有在创造 alpha。他们在给数字画框——那些数字早就从 CapIQ 拉出来了,早就在模型里交叉验证过了,早就被 VP 批过了。横在数据和格式化 slide 之间的,只有一个宁可去睡觉的人。

Anthropic 的 financial-services 仓库用一个文件替代了这个 workflow。一个包含 system prompt 和领域指令的 markdown 文件。没有构建步骤。没有 CI/CD。没有 Docker 容器。就一个文件,和一个知道怎么读它的 Agent。

这个仓库发布了 11 个 Agent、30+ 个技能和 11 个数据连接器——全部来自一套源码,支持两种部署方式:作为 Claude Cowork 插件,或作为 API 背后的 headless managed agent。一切皆为 markdown 和 JSON。一切皆可组合。

它不一样的地方

大多数”AI + 金融”产品,就是在数据终端外面套一层聊天界面,然后就收工了。这个不是。

这些 Agent 端到端地负责 workflow。Pitch Agent 不只是回答问题——它跑 comps、拉 precedents、建 LBO、填品牌化的 deck。Earnings Reviewer 吃进电话会纪要加 filings,产出模型更新和研究笔记初稿。GL Reconciler 找到差异、追溯到根因、路由给审批人。每个 Agent 是一个完整的 workflow,不是干到一半就交棒的聊天机器人。

架构从底到顶都是文件驱动的。System prompt 在 “agents/slug.md”。领域指令在 “skills/” 里,以 markdown 文件存放。数据连接器在 “.mcp.json” 里。零构建步骤意味着你测试的和发布的是同一套东西——你编辑的文件就是运行时用的文件。

大多数 Agent 平台把你锁进它们的部署模型。这套方案把同样的文件既作为桌面插件发布,也作为 API 可调用的 Agent 发布。相同源码,相同行为,两种运行时。

十一个 MCP 连接器已预集成:Daloopa、Morningstar、S&P Global、FactSet、Moody’s、MT Newswires、Aiera、LSEG、PitchBook、Chronograph 和 Egnyte。这些把 Claude 接入真实的金融数据——不是沙箱,不是 demo 数据集。来自 LSEG 和 S&P Global 的合作伙伴插件还提供了债券相对价值、互换曲线和 Capital IQ tear sheet。

Microsoft 365 插件把 Claude 嵌入 Excel、PowerPoint、Word 和 Outlook——指向你自己的云(Vertex AI、Bedrock 或内部网关),而非 Anthropic 的 API。

适用场景和适合谁用

投行业务。Pitch book 制作、CIM 撰写、teaser 创建、buyer list 构建、merger model、process letter、deal tracking。仓库里为 deal 生命周期的每个步骤都准备了对应的 Agent 或 slash command。

股票研究。季报点评、首次覆盖报告、模型更新、晨会笔记、行业概览、投资逻辑跟踪、选股思路。电话会结束后跑 “/earnings”,在一个小时内拿到初稿。

私募股权。带 CRM 集成的 deal sourcing、CIM 快速筛选、按 workstream 拆分的尽调清单、IC memo 撰写、被投公司 KPI 监控、价值创造计划。” /ic-memo ” 命令把财务数据、comps、回报分析和风险提示整合成一份文档。

财富管理。客户会议准备、财务规划、组合再平衡、税损收割、投资建议书。不如 M&A 光鲜,但产能提升是一样的。

基金运营。GL 对账、差异追踪、应计费用、roll-forward、差异说明、NAV 核对、LP statement 审计。这些工作没人想碰——正因如此,它们被放进了仓库。

会在哪里翻车,以及什么时候别用

每个输出都需要人工复核。仓库明确声明:这里的一切不构成投资、法律、税务或会计建议。这些 Agent 起草分析师的工作成果,由合格的专业人士审查。跳过人工签字不是在追求效率——是在追求责任事故。

MCP 连接器需要订阅。Daloopa、PitchBook、LSEG——这些都是付费数据服务。连接器是预先搭好的,但数据不会在没有有效许可证的情况下流动。在算力成本之外,把数据成本也放进预算。

文件驱动架构很强大,但把维护责任交给了你。改 “.mcp.json” 来换连接器。编辑 skill 文件来加入公司上下文。通过 “/ppt-template” 来引入模板。这是灵活性,不是魔法——需要有人维护这些文件,保持它们与实际 workflow 的一致性。

Agent 质量在 scope 膨胀时下降。Pitch Agent 做 pitch deck。Earnings Reviewer 做季报点评。不要让一个 Agent 去覆盖另一个的领地——system prompt 被封窄是有原因的。编辑 scope 来匹配你的 workflow,而不是让一个 Agent 什么都做。

不要用这些 Agent 处理监管报送、未经复核的最终客户交付物,或者任何错误会带来法律责任的输出。模型偶尔会幻觉一个倍数,或张冠李戴一个数据点。你的工作就是抓住它。

上手

安装 marketplace,选你的 Agent:

# 添加 marketplace
claude plugin marketplace add anthropics/claude-for-financial-services

# 核心技能 + 连接器(先装这个)
claude plugin install financial-analysis@claude-for-financial-services

# 具名 Agent —— 挑你需要的
claude plugin install pitch-agent@claude-for-financial-services
claude plugin install earnings-reviewer@claude-for-financial-services
claude plugin install market-researcher@claude-for-financial-services
claude plugin install gl-reconciler@claude-for-financial-services

# 垂直领域技能包
claude plugin install investment-banking@claude-for-financial-services
claude plugin install equity-research@claude-for-financial-services
claude plugin install private-equity@claude-for-financial-services

在 Claude Cowork 中,打开 Settings → Plugins → Add plugin,粘贴仓库 URL。Agent 会出现在调度菜单中,技能自动激活,slash command 可用在你的 session 里。

Headless 部署方式:

export ANTHROPIC_API_KEY=sk-ant-...
scripts/deploy-managed-agent.sh gl-reconciler

“managed-agent-cookbooks/” 下的每个模板引用了与插件版本相同的 system prompt 和技能。部署脚本解析文件引用、上传技能、创建子 Agent,并将编排器 POST 到 “/v1/agents”。

30 分钟内把它变成你自己的

先换连接器。把 “.mcp.json” 指向你的数据提供商和内部系统。预建的连接器是起点——你的数据栈不一样。

然后加入公司上下文。把你们的术语、流程规范和格式标准放到对应垂直领域的 skill 文件里。五行公司特有的指令,胜过五十页通用指南。

教 Claude 认识你的模板。拿你们品牌的 deck 跑一次 “/ppt-template”,它就学会了你的布局。Excel 模型同理——把 comps 模板给它看一次,后续输出都会匹配你的格式。

最后调整 Agent scope。每个 Agent 的 system prompt 都住在一个 markdown 文件里。如果你的团队先跑 comps 再查 precedents,把顺序换过来。如果你用不同的估值方法论,描述它。

这个仓库就是设计来 fork 的。照着结构复制出还没覆盖的 workflow——模式是一样的:system prompt、技能、命令,就完成了。

一个端到端示例:从 CIM 到 IC memo

周二早上,一个 PE associate 收到一份 inbound CIM。以下是这套 Agent 栈并行运行时接下来 90 分钟的情况。

Associate 把 CIM 扔给 Claude,跑 “/screen-deal”。Agent 解析文档,提取财务数据和 KPI,依据基金的标准给出通过/淘汰的评估——收入门槛、利润率 Profile、市场地位、增速。它会标记缺失的信息。Associate 读输出,同意判断,决定继续推进。

接着跑 “/comps”,拉可比公司和先例交易。Agent 通过 MCP 连接器访问 PitchBook 和 CapIQ,构建带 EV/EBITDA 和 P/E 倍数的交易 comps 表,再跑 ±1x 的敏感性分析。Associate 调整了可比公司列表——Agent 选的大致合理,但漏了两家。

最后,“/ic-memo” 把所有东西串起来:投资逻辑、公司概况、财务摘要、comps 输出、多情景 IRR 和 MOIC 回报分析、关键风险、尽调问题、投资建议。输出用的是基金的品牌模板格式,因为模板教过一遍,之后都在复用。

Associate 花 30 分钟复核、调整假设、打磨措辞。另外 60 分钟原本会是机械劳动——拉数据、格式化表格、填模板。这部分已经消失了。

总计节省:每笔 deal screening 大约一小时。按每位 associate 每年筛 200 个项目算,这个账不用细算。

接下来做什么

从一个 Agent、一个垂直领域开始。Pitch Agent 还是 Earnings Reviewer,取决于你的团队面向交易还是面向市场。先把数据连接器跑通,把公司上下文调准,把 review loop 建立起来,然后再加更多 Agent。

仓库是 Apache 2.0 许可,开放贡献。新技能放在 “plugins/vertical-plugins/skills/” 下。新 Agent 遵循 “agents/slug.md” + “skills/” 的模式。提交前跑 “python3 scripts/check.py”——它会 lint 所有 manifest 并验证所有跨文件引用都能解析。

文件驱动的 Agent 不是过渡方案,不是等更好的东西出现前的临时替代品。它们是正确的抽象:可组合、可审计、可 fork、无需构建流水线就能部署。对于流程明确但劳动密集的领域 workflow,它们已经是最优解。

如果你的团队每周在机械性分析工作上花超过五小时,这笔账已经对你有利了。试一个 Agent。给它你的模板和公司上下文。然后你自己判断。

GitHub: https://github.com/anthropics/financial-services

相关文章

Claude Code 2.1.136:当 AI Agent 的安全阈门从‘相信’变成‘验证’

Claude Code 2.1.136:当 AI Agent 的安全阈门从‘相信’变成‘验证’

你让 Claude Code 在 auto mode 下跑一个长任务,回来发现它把你的 AWS credentials 写进了日志文件。或者更糟:它在你没看到的一个弹窗里点了 "允许",然后把一个安全 ...

Agent 失败时:不会无限循环的恢复模式

Agent 的失败不抛异常。它们产出看起来合理但错误的输出,或者用稍微不同的方式悄悄重试同一个坏方法。把 Agent 包在 try/catch 里是错误的心智模型——Agent 没崩,它只是继续往一个 ...

没有标准答案的 Agent 怎么评测

评测一个 Prompt 已经很难。评测一个在给出答案前要跑十次工具调用的 Agent,是另一个量级的难。能产生正确答案的轨迹很少完全相同。能产生错误答案的轨迹常常一直看起来合理,直到第七步。标准的精确 ...

Agent 护栏:在不阉割 Agent 的前提下

给 Agent 加护栏属于那种简单版本太严苛、谨慎版本太宽松的任务。挡得太狠 Agent 拒绝完全合理的任务;挡得太松,新闻头条自己就写出来了。第一版要么是什么都不肯做的聊天机器人,要么是不该做那件事 ...

Agent Harness:为什么你的模型不是问题所在

LangChain 在 TerminalBench 2.0 上从 30 名开外飙到了第 5 名。他们没有换模型。同一个 LLM。同样的参数。唯一改变的是包裹在模型外面的那层软件——Harness。 ...

Planner-Executor 拆分:什么时候该拆,什么时候该合

第一天,让单个模型同时做规划和执行,看起来很优雅。三个月后,trace 日志会讲一个不同的故事:Prompt 里负责规划的那部分在工具调用上下文中开始漂移,负责执行的那部分开始幻觉出从未被规划过的步骤 ...

Postiz Agent CLI:把 28 个社交平台的发布权交给你的 AI

你写了一个能读 RSS、能总结论文、能生成配图的 AI Agent,结果发现最后一英里卡住了:它没法把内容发出去。 不是技术问题,是生态断层。大多数社交媒体平台只给人类设计 UI,API 文档散落在 ...

用经典编程规则喂饱你的 AI 编码 Agent

用经典编程规则喂饱你的 AI 编码 Agent

AI Coding Agent 写代码的速度远超人类,但它们不天然知道什么代码算是好代码。没有明确约束,Agent 产出的代码在 demo 里看起来功能完整,三个月后在维护追索里看起来一团乱——函数过 ...

工具选择:什么时候该模型挑,什么时候该你挑

会用工具的 Agent 在 demo 里看起来很有力,因为模型在选下一步做什么。它在生产里看起来很脆弱,因为模型在选下一步做什么。可用工具的空间随特性线性增长,随边界情况二次增长——超过大约十二个工具 ...

Claude Code 102 教给学术研究者的五件事

Claude Code 102 教给学术研究者的五件事

2026 年 5 月 11 日,Mushtaq Bilal, PhD 发布了《Claude Code 102 for Academic Researchers》,这是他教程系列的第二篇。第一篇 Cla ...

Dexter:为金融研究而生的自主 Agent

Dexter:为金融研究而生的自主 Agent

金融研究是一个天然适合 AI Agent 的领域——数据公开、步骤可结构化、输出是分析而非行动。但多数通用 Agent 在这个场景里会暴露两个问题:碰到的数据格式太多太杂,每步都要重新理解上下文;缺少 ...

OpenClaw 终于长出手和眼:Peekaboo v3

OpenClaw 终于长出手和眼:Peekaboo v3

OpenClaw 之前能接消息、能调 Agent、能把结果送到各个聊天渠道,但缺一双手和眼睛。Agent 在聊天框里给建议容易,要它实际操作桌面上的按钮、菜单、弹窗、输入框,之前没有可靠的本地执行层。 ...

多自主才算太自主

Agent 的自主性是一根滑杆,不是一个开关,正确档位由任务决定的多过由技术决定的。把滑杆推到"完全自主"的本能是真的,因为那样 demo 看起来很神奇。代价后来在客服队列里出现,那时一个 Agent ...

Agent 记忆:情景、语义,以及该留下什么

你建的第一个 Agent 没有当前对话之外的任何记忆,这能撑大约一周。然后用户回来,期望连续性,你开始往上贴记忆:一张数据库表、一个向量库、把过去会话的摘要塞进 system prompt。三个月后, ...