用经典编程规则喂饱你的 AI 编码 Agent
AI Coding Agent 写代码的速度远超人类,但它们不天然知道什么代码算是好代码。没有明确约束,Agent 产出的代码在 demo 里看起来功能完整,三个月后在维护追索里看起来一团乱——函数过 ...
Dexter:为金融研究而生的自主 Agent
金融研究是一个天然适合 AI Agent 的领域——数据公开、步骤可结构化、输出是分析而非行动。但多数通用 Agent 在这个场景里会暴露两个问题:碰到的数据格式太多太杂,每步都要重新理解上下文;缺少 ...
Human-in-the-Loop:为交接设计,而不是为推翻设计
- Sam Wilson
- UX , Human in the Loop
- 06 May, 2026
多数 human-in-the-loop 系统的设计假设是:人类是兜底的——出现在那里,在模型出错时推翻它。这种框架产出的界面,要求人类审阅又长又密的 Agent 轨迹然后通过或拒绝。通过率高、错误捕 ...
没有标准答案的 Agent 怎么评测
- William Jacob
- 评测 , Agent
- 05 May, 2026
评测一个 Prompt 已经很难。评测一个在给出答案前要跑十次工具调用的 Agent,是另一个量级的难。能产生正确答案的轨迹很少完全相同。能产生错误答案的轨迹常常一直看起来合理,直到第七步。标准的精确 ...
Agent 记忆:情景、语义,以及该留下什么
- Sam Wilson
- 架构 , 记忆
- 05 May, 2026
你建的第一个 Agent 没有当前对话之外的任何记忆,这能撑大约一周。然后用户回来,期望连续性,你开始往上贴记忆:一张数据库表、一个向量库、把过去会话的摘要塞进 system prompt。三个月后, ...
Agent 失败时:不会无限循环的恢复模式
- Sam Wilson
- 可靠性 , Agent
- 04 May, 2026
Agent 的失败不抛异常。它们产出看起来合理但错误的输出,或者用稍微不同的方式悄悄重试同一个坏方法。把 Agent 包在 try/catch 里是错误的心智模型——Agent 没崩,它只是继续往一个 ...
Multi-Agent 系统:协调才是真正的难点
- John Doe
- 架构 , Multi Agent
- 03 May, 2026
Multi-Agent 架构很有诱惑力,因为它映射到人类组织工作的方式:专家、协调者、交接协议。第一次把复杂任务在"研究员"Agent 和"作者"Agent 之间拆分时,结果确实更好。第三次的时候,你 ...
Planner-Executor 拆分:什么时候该拆,什么时候该合
- Sam Wilson
- 架构 , Agent
- 03 May, 2026
第一天,让单个模型同时做规划和执行,看起来很优雅。三个月后,trace 日志会讲一个不同的故事:Prompt 里负责规划的那部分在工具调用上下文中开始漂移,负责执行的那部分开始幻觉出从未被规划过的步骤 ...
工具选择:什么时候该模型挑,什么时候该你挑
- William Jacob
- 工具 , Agent
- 02 May, 2026
会用工具的 Agent 在 demo 里看起来很有力,因为模型在选下一步做什么。它在生产里看起来很脆弱,因为模型在选下一步做什么。可用工具的空间随特性线性增长,随边界情况二次增长——超过大约十二个工具 ...
分类
标签
- Autonomous
- Agents
- Claude code
- Security
- Auto mode
- Permissions
- Agent safety
- Error recovery
- Eval
- Guardrails
- Safety
- Harness
- Orchestration
- Production engineering
- Human in loop
- Ux
- Memory
- Multi agent
- Coordination
- Planning
- Executor
- Postiz
- Social media
- Cli
- Agent tools
- React pattern
- Loops
- Coding rules
- Agent
- Agentsmd
- Tool use
- 学术研究
- Ai工具
- Ai编程
- Financial agent
- Research
- Financial services
- Reference architecture
- Openclaw
- Peekaboo
- Computer use
- Macos
- Product hunt
- Ai agent
- 语音ai
- Mcp
- 内容生产
- 2025趋势
- Wiseclaw
- Agent os
- 医疗ai
- 多智能体
- Skill系统
- 智诊