架构
Agent Harness:为什么你的模型不是问题所在
- William Jacob
- Agent , 架构
- 11 May, 2026
LangChain 在 TerminalBench 2.0 上从 30 名开外飙到了第 5 名。他们没有换模型。同一个 LLM。同样的参数。唯一改变的是包裹在模型外面的那层软件——Harness。 ...
Agent 记忆:情景、语义,以及该留下什么
- Sam Wilson
- 架构 , 记忆
- 05 May, 2026
你建的第一个 Agent 没有当前对话之外的任何记忆,这能撑大约一周。然后用户回来,期望连续性,你开始往上贴记忆:一张数据库表、一个向量库、把过去会话的摘要塞进 system prompt。三个月后, ...
Multi-Agent 系统:协调才是真正的难点
- John Doe
- 架构 , Multi Agent
- 03 May, 2026
Multi-Agent 架构很有诱惑力,因为它映射到人类组织工作的方式:专家、协调者、交接协议。第一次把复杂任务在"研究员"Agent 和"作者"Agent 之间拆分时,结果确实更好。第三次的时候,你 ...
Planner-Executor 拆分:什么时候该拆,什么时候该合
- Sam Wilson
- 架构 , Agent
- 03 May, 2026
第一天,让单个模型同时做规划和执行,看起来很优雅。三个月后,trace 日志会讲一个不同的故事:Prompt 里负责规划的那部分在工具调用上下文中开始漂移,负责执行的那部分开始幻觉出从未被规划过的步骤 ...
生产环境的 ReAct:经得起跑题的推理循环
ReAct 是一个干净的想法:思考、行动、观察、循环。在生产环境里,循环本身才是最容易崩的部分。模型在前几步推理得还算合理,然后要么过度解释,要么对工具调用反复纠结,要么自说自话地认定任务已经完成。教 ...