Caveman:砍掉 AI 80% 废话,一个让编码助手闭嘴干活的开源利器
你坐在终端前,盯着 Claude Code 输出一段长达 300 字的解释,来回答一个只需要 30 字的问题。你知道这段文字花了你多少钱——每一个 Token 都是按量计费的,而其中大半是”您的思路非常好”、“让我补充说明一下”、“希望这对您有帮助”这类问候和客套。而你已经习惯了。问题是:你到底在为 AI 的什么买单?
这不是个别现象。有开发者做过统计:同是解释一个 React 组件重渲染 Bug,普通模式跑了 1180 Token,Caveman 模式只烧了 159 Token,结果完全对等——直接砍掉 87%。GitHub 上一个名叫 Caveman 的项目,只做了一个决定,就拿到了 44.8K Star:把模式切到极简,拒绝一切社交润滑。
Caveman 的思路粗暴到令人感动。它不修改模型参数,不换架构,不做精调。它只做一件事:在 System Prompt 里告诉 AI,“你不是文明人,你是野人。别寒暄,别铺垫,别总结。直接说事”。听起来像开玩笑,但效果是真实的。强制模型进入简洁模式后,研究发现准确率不仅不降,反而因为卸下了”维护礼貌人设”的认知负担而略有提升。
它不是一刀切。Caveman 给了三档压缩强度。Lite 模式精简填充词,保留完整句式,适合正式记录和对外文档。Full 是默认态,砍冠词、碎片化表达、纯野人风格,日常开发沟通和查错时最顺手。Ultra 直接进入电报模式,大量缩写和符号替代,追求极致的 Token 省钱。更关键的是,它分得清什么是废话什么是代码:技术名词、函数名、文件路径、代码块全部原封保留,只把自然语言里的虚词和修饰成分碾碎。
想象一个典型的下午:你连续调试三个 Bug,每个要来回三四轮。认证中间件过期问题的排查跑了 704 Token,PostgreSQL 连接池配置居然烧了 2347 Token,React 错误边界组件实现干到 3454 Token。切换到 Caveman 后,这三个数字分别变成 121、380 和 456。一小时高密度对话的 10 万 Token 变成了不到 2 万。省下的不是钱——钱只是表象。真正省下的是打断你思路的等待时间,是翻屏找关键信息的注意力开销。
三个场景最能说明它的价值。场景一:你接到一个陌生报错,只想快速知道根因和修复方式,不需要副陪词汇和延伸阅读。Caveman Full 模式给一个碎片化的技术结论,半句话切入正题。场景二:你在做代码审查,需要 AI 逐段扫描安全隐患。Caveman 的压缩比约为 41%,明显低于常规问答场景的 80%+,因为代码审查本身就需要完整的逻辑链条——这说明压缩不是盲目砍,而是从”有没有必要说”的维度评估每一句。场景三:你在写对外同步的技术文档,需要精炼但完整的句式。Lite 模式保留语法框架,只是剔掉了纯粹的语气词和重复表述。
但 Caveman 也有局限。它不适合需要自然对话温度的场景,比如新手学习、面试模拟、头脑风暴。在需要解释性上下文的复杂架构讨论中,过度压缩可能丢失推导步骤。Ultra 模式的缩写习惯可能让其他团队成员看不懂你的聊天记录。另外,它依赖 System Prompt 级别的约束,不是一个硬编码的截断器——某些模型可能比另一些模型更”听话”。说到底,它只是一个 Prompt 技巧的外包,效果取决于底层模型对指令的服从程度。
Caveman 的安装简单到一行命令。Claude Code 用户可以直接通过插件市场装:claude plugin marketplace add JuliusBrussee/caveman,然后 claude plugin install caveman@caveman。Cursor、Copilot、Windsurf、Cline 等工具走通用路径:npx skills add JuliusBrussee/caveman。装好之后,在对话里敲 /caveman 就切入野人模式,说 stop caveman 就回到文明世界。切换强度也只是一句话的事:/caveman ultra。
你对 AI 的每一次付费里,有一半是情绪价值。敢砍掉这一半的人,开发效率才算真正翻页。