Dexter：为金融研究而生的自主 Agent

John Doe
Agent , 金融
07 May, 2026

金融研究是一个天然适合 AI Agent 的领域——数据公开、步骤可结构化、输出是分析而非行动。但多数通用 Agent 在这个场景里会暴露两个问题：碰到的数据格式太多太杂，每步都要重新理解上下文；缺少金融领域的验证逻辑，把错误的数字放进正确的报告里。Dexter 是 virattt 开源的自主金融研究 Agent，24.5k stars，定位可以概括为”为金融研究定制的 Claude Code”。

它怎么工作

Dexter 把一个复杂金融问题拆成结构化的研究步骤，逐步执行——调收入表、拉资产负债表、读现金流，做完一步自己检查结果再决定下一步。不是简单的 ReAct 循环：它有任务规划层（把”分析苹果公司过去五年的盈利能力”分解成具体子任务），有工具执行层（调用 Financial Datasets API、Exa 搜索），有自我验证层（检查数据完整性和逻辑一致性）。每次调用的完整记录写进 scratchpad 文件，方便回调查错。底层的 LLM 可以换——OpenAI、Anthropic、Google、xAI 都支持，本地也能跑 Ollama。

不是 demo，能真用

安装就是 git clone + bun install + 配 API key（Financial Datasets、Exa、OpenAI），然后 bun start 进入交互模式。它还带一个完整的评测套件——LangSmith 追踪、LLM-as-judge 打分、可以按随机采样跑。WhatsApp gateway 让你在手机上和它聊天，发条消息给自己就能让 Dexter 去查数据。440 次提交、23 个 tag、每月还在加新工具——这不是一个周末项目，是一个在生产节奏里维护的开源系统。

Dexter 证明了 Agent 在垂直领域可以走多远——当通用 Agent 还在规划怎么写邮件时，它已经在分析苹果过去五年的自由现金流趋势了。

Caveman：砍掉 AI 80% 废话，一个让编码助手闭嘴干活的开源利器

John Doe
Agent , 开发工具
06 Jun, 2026

你坐在终端前，盯着 Claude Code 输出一段长达 300 字的解释，来回答一个只需要 30 字的问题。你知道这段文字花了你多少钱——每一个 Token 都是按量计费的，而其中大半是"您的思路非 ...

Postiz Agent CLI：把 28 个社交平台的发布权交给你的 AI

John Doe
工具 , Agent
09 May, 2026

你写了一个能读 RSS、能总结论文、能生成配图的 AI Agent，结果发现最后一英里卡住了：它没法把内容发出去。不是技术问题，是生态断层。大多数社交媒体平台只给人类设计 UI，API 文档散落在 ...

Claude Code 2.1.136：当 AI Agent 的安全阈门从‘相信’变成‘验证’

John Doe
安全 , Agent
09 May, 2026

你让 Claude Code 在 auto mode 下跑一个长任务，回来发现它把你的 AWS credentials 写进了日志文件。或者更糟：它在你没看到的一个弹窗里点了 "允许"，然后把一个安全 ...

用经典编程规则喂饱你的 AI 编码 Agent

John Doe
Tooling , Agent
07 May, 2026

AI Coding Agent 写代码的速度远超人类，但它们不天然知道什么代码算是好代码。没有明确约束，Agent 产出的代码在 demo 里看起来功能完整，三个月后在维护追索里看起来一团乱——函数过 ...

Agent Harness：为什么你的模型不是问题所在

William Jacob
Agent , 架构
11 May, 2026

LangChain 在 TerminalBench 2.0 上从 30 名开外飙到了第 5 名。他们没有换模型。同一个 LLM。同样的参数。唯一改变的是包裹在模型外面的那层软件——Harness。 ...

Vibe-Trading：把交易想法变成可回测研究的个人金融 Agent

Smars
Agent , 金融研究
18 May, 2026

你问一个交易问题，LLM 可以给你一段漂亮解释。问题是：它没有数据、没有回测、没有报告、没有复现实验路径。你得到的是观点，不是研究。金融 Agent 最危险的地方，不是它不会说话，而是它太会说话。 ...

查看更多 →