Vibe-Trading:把交易想法变成可回测研究的个人金融 Agent

Vibe-Trading:把交易想法变成可回测研究的个人金融 Agent

你问一个交易问题,LLM 可以给你一段漂亮解释。问题是:它没有数据、没有回测、没有报告、没有复现实验路径。你得到的是观点,不是研究。

金融 Agent 最危险的地方,不是它不会说话,而是它太会说话。一个不能拉数据、不能验证、不能留下 artifacts 的交易助手,只是在用更流畅的语言制造幻觉。

Vibe-Trading 试图把这件事拉回工程地面:自然语言只是入口,后面必须接市场数据、策略代码、回测引擎、验证报告和可追踪的研究记忆。

Vibe-Trading 是什么

Vibe-Trading 是 HKUDS 开源的个人交易研究 Agent。官方定位是 “Your Personal Trading Agent”,一句话目标是:用一条命令让 Agent 具备完整交易研究能力。

它不是自动下单系统。README 明确写着:Vibe-Trading 用于 research、simulation 和 backtesting,不执行 live trades。

这条边界很重要。它把 Vibe-Trading 从”自动赚钱机器人”拉回到一个更可靠的位置:帮你把交易问题变成可运行、可复查、可继续迭代的研究流程。

截至 2026 年 5 月,GitHub 仓库 HKUDS/Vibe-Trading 约有 7.5k stars 和 1.5k forks。项目更新频率很高,2026-05-17 的 Alpha Zoo v1 已内置 452 个量化 alpha,覆盖 qlib158、alpha101、gtja191 和 academic 四个 zoo。

它强在哪里

Vibe-Trading 的优势不是”让 LLM 看行情”。行情查询只是第一步。它真正做的是把一个金融研究任务拆成可执行链路。

做什么
Plan选择金融 skills、tools、数据源和 swarm preset
Ground拉取 A 股、港股、美股、加密、期货、外汇、文档或网页上下文
Execute生成可测试策略代码,运行工具,调用匹配的回测或分析流程
Validate加入 benchmark、Monte Carlo、Bootstrap、Walk-Forward、run cards 和 warnings
Deliver输出报告、artifacts、tool traces、TradingView / TDX / MetaTrader 5 导出

这套结构让 Agent 不只是回答你”策略可能有效”,而是留下一个能检查的运行目录:策略代码、指标、基准比较、验证结果、报告和后续 session 可复用的上下文。

核心能力

自然语言研究到回测。 你可以直接问:“Backtest a BTC-USDT 20/50 moving-average strategy for 2024, summarize return and drawdown, then export the report”。Agent 会把请求转成数据加载、策略生成、回测和报告流程。

跨市场数据。 项目覆盖 A 股、港股、美股、加密、期货和外汇。README 也强调:很多市场可以不用额外 API key,通过 yfinance、OKX、AKShare 等免费数据源 fallback 跑起来。

多智能体交易团队。 Vibe-Trading 提供预配置 swarm presets,例如 investment committee、global equities desk、crypto trading desk、quant strategy desk、risk committee。它不是让一个 Agent 自言自语,而是把研究、量化、风控、宏观等角色拆开。

持久研究记忆。 项目支持跨 session memory、搜索、复用和可编辑 skills。对交易研究来说,这比单轮聊天重要得多:你不是每次从零开始解释自己的偏好、约束和常用流程。

Shadow Account。 上传券商交易记录后,Agent 会分析你的交易行为,提取规则,再和一个规则化 shadow strategy 对比。它关注的不是”你赚没赚”,而是你在哪些地方偏离了自己的规则:过早离场、错过信号、过度交易、追涨、锚定。

Alpha Zoo。 0.1.8 加入 452 个预置量化 alpha,能用一行命令在指定 universe 和时间段上跑 IC、IR 以及 alive/reversed/dead 分类。这是给量化研究者的硬货,不是展示页功能。

数据源与市场覆盖

Vibe-Trading 的数据层不是单一供应商,而是多 loader + 自动 fallback。README 里当前列出的 backtest loaders 有 6 个:tushare、okx、yfinance、akshare、ccxt、futu。

数据源主要覆盖是否必须配置 key
yfinance港股、美股、ETF、指数等 Yahoo Finance 可取到的标的
OKX加密货币行情,尤其适合 BTC-USDT 这类 crypto 策略研究
AKShareA 股、港股、美股、期货、外汇等公开金融数据聚合
CCXT100+ 加密交易所,取决于交易所支持的 spot、swap、futures 等市场通常行情不需要,私有账户接口需要
TushareA 股行情、财务报表、财务指标、点时安全的基本面字段可选,TUSHARE_TOKEN
Futu港股和 A 股相关行情接入,适合本地 Futu OpenD 工作流取决于本地 Futu 环境

官方提示也很明确:所有市场都可以在没有数据 API key 的情况下通过自动 fallback 跑起来。yfinance 负责 HK/US,OKX 负责 crypto,AKShare 负责 A 股、US、HK、futures、forex;Tushare token 是可选项,AKShare 会作为 A 股免费 fallback。

支持的市场可以这样理解:

市场典型标的 / universe常见用途
A 股沪深个股、CSI 300 成分、A 股多因子 universe多因子、基本面筛选、Alpha Zoo、风控过滤
港股港股个股、H 股、港股相关 ETF全球权益研究、AH 比价、港股策略
美股AAPL 等美股个股、ETF、指数技术策略、组合分析、ETF flow、SEC filing 研究
加密货币BTC-USDT、ETH-USDT、交易所 spot / derivatives趋势、均值回归、资金费率、basis、清算热力图
期货AKShare / CCXT / 交易所可取到的合约商品、股指、跨市场策略原型
外汇主要 FX 汇率和宏观相关数据macro rates FX desk、汇率研究、资产配置
衍生品与专题资产options、convertible bonds、ETF、ADR/H-share、DeFi yield专题分析和 agent skill 工作流

这不是说每个市场都有同等级、同颗粒度、同许可证的数据。免费源适合研究、原型和复盘;如果你要做严肃基本面或生产级回测,Tushare、Futu 或自带数据源仍然要单独评估。

适合哪些场景

把交易想法变成可回测实验。 你有一个规则,但还停留在口头描述。Vibe-Trading 适合把它变成策略代码、跑历史数据、看指标和报告。

复盘自己的交易行为。 如果你能导出券商交易流水,Shadow Account 可以帮你把”我感觉自己拿不住”变成可观察的行为诊断。

做跨市场研究。 A 股、港股、美股、crypto、期货、外汇经常需要不同数据源和回测规则。Vibe-Trading 的价值在于把这些市场放进同一个研究工作台。

把金融 Agent 接入现有工具链。 它提供 CLI、Web UI 和 MCP server。你可以单独使用,也可以接进 Claude Desktop、OpenClaw、Cursor 这类 Agent 环境。

不适合的地方

不要用它做实盘自动交易。 官方已经把边界说清楚:研究、模拟、回测,不执行 live trades。你可以用它生成和验证想法,但不要把它当交易执行层。

不要相信单次回测结论。 金融数据里最容易出现 lookahead、过拟合、幸存者偏差和数据源口径差异。Vibe-Trading 提供 validation 和 run cards,但你仍要检查假设。

不要把免费数据源当机构级数据。 yfinance、AKShare、OKX 适合快速研究和原型,不等于生产级行情、复权、财务点时数据都完全可靠。

不要把多 Agent 辩论当真理。 Swarm 能暴露多角度,但多个 LLM 互相讨论不等于市场共识。它是研究辅助,不是风险背书。

Vibe-Trading 最值得借鉴的地方,不是交易,而是它把 Agent 输出压进了可验证的研究流程。

安装

最快路径是 PyPI:

pip install vibe-trading-ai

安装后会得到三个主要命令:

命令用途
vibe-trading交互式 CLI / TUI
vibe-trading serve启动 FastAPI Web server
vibe-trading-mcp启动 MCP server

首次运行:

vibe-trading init
vibe-trading run -p "Backtest a BTC-USDT 20/50 moving-average strategy for 2024 and summarize return and drawdown"

如果你想用 Docker 立即试:

git clone https://github.com/HKUDS/Vibe-Trading.git
cd Vibe-Trading
cp agent/.env.example agent/.env
docker compose up --build

然后打开 http://localhost:8899。

快速上手:自然语言回测

最小闭环是:提问、拉数据、回测、输出报告。

vibe-trading run -p "Backtest a BTC-USDT 20/50 moving-average strategy for 2024, summarize return and drawdown, then export the report"

更适合研究的写法,是把约束说清楚:

vibe-trading run -p "Backtest a BTC-USDT 20/50 moving-average crossover strategy for 2024. Use daily candles, include fees if supported, compare against buy-and-hold, report CAGR, max drawdown, Sharpe, trade count, and export the run artifacts."

好的 prompt 不该只问”这个策略怎么样”。你要指定市场、周期、频率、基准、费用、指标和交付物。否则 Agent 会替你补假设,而这些假设正是金融研究里最容易出事的地方。

实践示例:复盘你的交易行为

Shadow Account 的入口很直接:

vibe-trading --upload trades_export.csv
vibe-trading run -p "Analyze my trading behavior, extract my shadow strategy, and compare it with my actual trades"

这个流程会做五件事:

步骤输出
读取交易日志解析券商导出的 CSV 或同类文件
生成行为画像持仓天数、胜率、盈亏比、回撤、行为偏差
提取规则把反复出现的入场和出场行为转成规则
运行 shadow用规则化策略回测对比真实交易路径
交付报告输出可检查、可归档、可继续迭代的 HTML/PDF

这个功能的价值不是替你算一个更漂亮的收益率,而是把模糊的交易习惯变成可验证的规则差异。

实践示例:跑 Alpha Zoo

如果你做因子研究,Alpha Zoo 是更硬核的入口。

vibe-trading alpha bench --zoo gtja191 --universe csi300 --period 2018-2025 --top 20

这条命令会在指定 universe 和时间段上评估一组预置 alpha,并给出 IC、IR 和状态分类。相比让 LLM “推荐几个因子”,这种方式更接近真实研究:先跑、再看、再决定是否值得深入。

常见坑

把 Vibe-Trading 当交易执行器。 它不是下单机器人。你可以用它生成研究结论,但实盘执行、风控、权限、审计要走独立系统。

忽略数据源差异。 同一标的在不同数据源里可能有复权、时区、缺失值和交易日口径差异。回测结果异常时,先查数据,不要先改策略。

只看收益,不看路径。 最大回撤、交易次数、换手、持仓时间、benchmark excess return 比单个总收益更重要。Agent 给出漂亮收益曲线时,也要问它怎么来的。

让 Agent 自己补研究假设。 市场、周期、频率、费用、滑点、基准、样本内外切分,这些都应该由你明确指定。含糊 prompt 会制造含糊结论。

把 API key 放到不可信部署。 README 里也提醒:非官方托管部署不应被视为 API key 或数据源 token 的可信存放位置。

结尾

Vibe-Trading 不是让 Agent 替你交易,而是让 Agent 把交易研究变成可运行、可验证、可复盘的工程流程。

下次你想问”这个策略行不行”,别只要一句判断。让它拉数据、跑回测、留报告。

GitHub: https://github.com/HKUDS/Vibe-Trading
Docs: https://vibetrading.wiki/

相关文章

Claude Code 2.1.136:当 AI Agent 的安全阈门从‘相信’变成‘验证’

Claude Code 2.1.136:当 AI Agent 的安全阈门从‘相信’变成‘验证’

你让 Claude Code 在 auto mode 下跑一个长任务,回来发现它把你的 AWS credentials 写进了日志文件。或者更糟:它在你没看到的一个弹窗里点了 "允许",然后把一个安全 ...

用经典编程规则喂饱你的 AI 编码 Agent

用经典编程规则喂饱你的 AI 编码 Agent

AI Coding Agent 写代码的速度远超人类,但它们不天然知道什么代码算是好代码。没有明确约束,Agent 产出的代码在 demo 里看起来功能完整,三个月后在维护追索里看起来一团乱——函数过 ...

Agent Harness:为什么你的模型不是问题所在

LangChain 在 TerminalBench 2.0 上从 30 名开外飙到了第 5 名。他们没有换模型。同一个 LLM。同样的参数。唯一改变的是包裹在模型外面的那层软件——Harness。 ...

Claude Code 102 教给学术研究者的五件事

Claude Code 102 教给学术研究者的五件事

2026 年 5 月 11 日,Mushtaq Bilal, PhD 发布了《Claude Code 102 for Academic Researchers》,这是他教程系列的第二篇。第一篇 Cla ...

Postiz Agent CLI:把 28 个社交平台的发布权交给你的 AI

你写了一个能读 RSS、能总结论文、能生成配图的 AI Agent,结果发现最后一英里卡住了:它没法把内容发出去。 不是技术问题,是生态断层。大多数社交媒体平台只给人类设计 UI,API 文档散落在 ...

Dexter:为金融研究而生的自主 Agent

Dexter:为金融研究而生的自主 Agent

金融研究是一个天然适合 AI Agent 的领域——数据公开、步骤可结构化、输出是分析而非行动。但多数通用 Agent 在这个场景里会暴露两个问题:碰到的数据格式太多太杂,每步都要重新理解上下文;缺少 ...