第 13 章驾驭曲线

最后一章，讲一个贯穿整本书但一直没有正面展开的话题——你和智能体的协作关系，是怎么一步步变化的。

开篇：回头看的意外发现

这份手记写到最后一章，我回过头翻前面十二章，发现一条隐藏的主线——我对"怎么跟 Agent 协作"这件事的理解，是随着项目一步步变化的。

前面十二章讲的每一条经验——harness 工程、颗粒度控制、工具设计、循环简化、eval、非确定性、多 Agent 协作——它们不是平行排列的知识点。它们背后有一条线：我和 Agent 的关系在变化。从最初的"许愿"，到后来的"划边界"，再到"驾驭"，最后到"让 Agent 驾驭 Agent"。

这条线不是我刻意规划的。是写这份手记的时候回头看，才看出来的。就像爬山——你在爬的时候只看脚下的路，到了山顶回头看，才发现自己走了四个明显不同的阶段。

我把这条线叫"驾驭曲线"。

四个阶段

第一阶段：许愿式

最开始用 Agent 的时候，我的状态是"许愿"。

我给 Agent 一个宏大的目标——"帮我做一个完整的系统"——然后等着它给我结果。我对 Agent 的约束几乎为零：没有写"该做什么不该做什么"，没有限定它的权限，没有定义什么叫"做好了"。

这个阶段的特征是：我把 Agent 当许愿池。 我扔进去一个愿望，等着它实现。如果实现了，我兴奋；如果没实现，我困惑。但无论是兴奋还是困惑，我都没有想过——问题可能出在"我许愿的方式"上。

第 3 章那个虚拟办公室的失败，就是这个阶段的典型。一份 390 行的调试计划、两天一把梭的代码、然后无尽的报错——我不知道问题出在"我给了 Agent 一个太大的、没有验证的交付单元"。

第二阶段：划边界

第一个项目失败之后，我学到了一件事：得先说清楚不做什么。

第二个项目里，我写了一份正式的 PRD，里面有一节叫"非目标"——明确列出"不做什么"。这是第一次主动给项目划边界。

技术选型也收敛了——能简单的就简单，能砍掉的复杂度就砍掉。

但这个阶段我还是没有真正"驾驭" Agent。我只是在约束自己——约束自己的野心，别什么都想要。我跟 Agent 的关系还是"我给目标，你执行"，只不过目标小了一些。

第三阶段：驾驭式

真正的变化发生在后面几个项目。我开始意识到——要约束的不只是目标，还有 Agent 的行为方式。

这个阶段我做的事包括：

在项目的指令文件里写"开发哲学"——"架构是长出来的""宁可错过也不要打扰""透明可控"——第一次对 Agent 的行为做显式约束
把给 Agent 的权限从"全开"收紧到精确到具体命令的白名单
给交付拆阶段，每个阶段有可验证的体验效果

这个阶段的特征是：我不再只是给目标，我开始管理"Agent 怎么工作"。 指令文件从"系统说明书"变成了"工作指南"。权限从"你看着办"变成了"你能做什么我都列好了"。

第四阶段：元驾驭式

最后一个阶段是这份手记第四部分讲的双 Agent 协作——让一个 Agent 去驾驭另一个 Agent。

我不直接指挥开发 Agent 干活，而是让 PM Agent 去拆任务、调开发 Agent、验收产出。我只在关键节点出现——审批越界操作、重试失败后兜底。

这个阶段的特征是：我从"执行者/指挥官"变成了"架构师/守门员"。 我的注意力被释放了——不再逐条指挥，而是设计协作体系、定义边界、兜底关键节点。

四个阶段的标志

怎么判断你在哪个阶段？我看四个东西就够了：

标志	许愿式	划边界	驾驭式	元驾驭式
指令文件	系统说明书 / 没有	有边界	有行为约束 / 开发哲学	约束已内化为 Agent 系统
权限	全开	粗放	白名单、精确到命令	由 Agent 系统管理
交付方式	一次性大需求	有"非目标"清单	分阶段 + 每阶段可验证	Agent 自己拆解 + 验收
人的角色	许愿	划边界	指挥官	架构师 / 审批者

有一个特别直观的物证可以帮你判断——看你给 Agent 的权限配置文件是怎么演进的。 我最早的权限是"什么都允许"，后来变成"允许 Python 所有操作"，再后来变成精确到具体命令的白名单，最后精确到连测试命令的参数都锁死。权限从粗放到精细的过程，就是驾驭能力升级的过程。

这条曲线不是线性的

跟第 2 章的"四阶认知"一样，这条驾驭曲线也不是线性的。

我不是"走完第一阶段再走第二阶段"这么整齐。我在第二阶段的项目里偶尔还会"许愿"（比如某个功能憋大招了），在第三阶段的项目里也尝试过"元驾驭"（比如让 Agent 调 CC）。真实的过程是螺旋的——大方向在升级，但时不时也会退回去。

所以不用纠结"我在第几阶段"。这四个阶段的价值是给你一面镜子——看看自己现在跟 Agent 的关系是什么模式，下一个阶段大概长什么样。

这份手记的定位

讲完驾驭曲线，可以回头说这份手记的定位了。

这份手记不是"Agent 工程教科书"。它不教你从零实现一个 Agent 框架，不覆盖所有技术栈，不追求知识的完整性。

它是一个程序员从"许愿式"走到"元驾驭式"的过程中，踩过的坑和提炼的经验。 每一章对应驾驭曲线上某个阶段的某个具体问题——harness 认知（第 1-2 章）、颗粒度失控（第 3 章）、工具设计（第 4 章）、循环简化（第 5 章）、eval 验证（第 6-7 章）、多 Agent 协作（第 8-10 章）、鲁棒性和质量门禁（第 11-12 章）。

如果你也在走这条路，希望这些经验能帮你少踩几个坑、少走两个项目的弯路。如果你走得比我远——比如已经在系统性地做 CI、做监控闭环、做超时重试熔断——那第五部分那些"我还没做到"的东西，正好是你的起点。

这一章的工具：你在哪个阶段？

🔧 驾驭阶段自检

诚实回答以下问题，看看你跟 Agent 的协作处于哪个阶段：

指令文件

[ ] 你给 Agent 的指令文件里，有没有"禁止做什么"？
[ ] 它是"系统说明书"（描述系统是什么）还是"工作指南"（告诉 Agent 怎么做）？

权限

[ ] 你给 Agent 的权限是"什么都允许"还是精确到具体命令？
[ ] 你有没有回头收紧过权限？（从粗放到精细的过程就是升级的过程）

交付方式

[ ] 你的需求是"一次大块"还是"分阶段、每阶段可验证"？
[ ] 每个交付单元有没有明确的"成了长什么样"？

人的角色

[ ] 你是在逐条指挥 Agent，还是在设计 Agent 运转的系统？
[ ] 你有没有让一个 Agent 去调用/监督另一个 Agent？

判断标准

四个都答"没有/前者" → 第一阶段（许愿式）
有边界了但还在逐条指挥 → 第二阶段（划边界）
开始约束 Agent 行为方式、权限精确化 → 第三阶段（驾驭式）
让 Agent 驾驭 Agent，人退到审批和兜底 → 第四阶段（元驾驭式）

小结

这是全文的最后一章正文。驾驭曲线四个阶段——许愿、划边界、驾驭、元驾驭——不是什么理论框架，是我自己走过的路。

回头看，这条路的核心变化就一个：人对 Agent 的控制方式，从"事后检查"逐渐前移到"事前设计"。 许愿式是"你做完了我就看看"，划边界是"我先说清不做什么"，驾驭式是"我设计好你该怎么工作"，元驾驭式是"我设计好 Agent 之间怎么协作"。

每一级的提升，都是把控制点前移一步——从"出了问题再补"到"提前设计好不让问题出现"。这条路的终点在哪里？我现在也不知道。但我知道，每往前走一步，出的问题就越少，能做的事情就越多。

下一章是结语——聊聊这份手记没讲什么，以及我接下来想往哪走。

结语 —— 诚实的边界，以及未来的方向。