架构
RAG 胜过微调的场景,以及它失效的场景
RAG 在早期部署战中胜出是有道理的:比微调便宜,知识库不用重新训练就能更新,而且你能审计模型看到了什么。对大多数问答和文档对齐任务,它仍然是正确架构。但失效模式是真实的,"加 RAG 就好"已经成了 ...
上下文窗口管理:当 128k 还不够用时
更大的上下文窗口本来应该让上下文工程过时。它没有。大海捞针测试显示模型能在 128k token 里找到某个事实;真正的失败发生在你要求模型在多步推理链里使用那个事实的时候。召回不等于推理,两者之间的 ...