架构

RAG 在早期部署战中胜出是有道理的：比微调便宜，知识库不用重新训练就能更新，而且你能审计模型看到了什么。对大多数问答和文档对齐任务，它仍然是正确架构。但失效模式是真实的，"加 RAG 就好"已经成了 ...

更大的上下文窗口本来应该让上下文工程过时。它没有。大海捞针测试显示模型能在 128k token 里找到某个事实；真正的失败发生在你要求模型在多步推理链里使用那个事实的时候。召回不等于推理，两者之间的 ...