第 13 章 驾驭曲线
最后一章,讲一个贯穿整本书但一直没有正面展开的话题——你和智能体的协作关系,是怎么一步步变化的。
开篇:回头看的意外发现
这份手记写到最后一章,我回过头翻前面十二章,发现一条隐藏的主线——我对"怎么跟 Agent 协作"这件事的理解,是随着项目一步步变化的。
前面十二章讲的每一条经验——harness 工程、颗粒度控制、工具设计、循环简化、eval、非确定性、多 Agent 协作——它们不是平行排列的知识点。它们背后有一条线:我和 Agent 的关系在变化。从最初的"许愿",到后来的"划边界",再到"驾驭",最后到"让 Agent 驾驭 Agent"。
这条线不是我刻意规划的。是写这份手记的时候回头看,才看出来的。就像爬山——你在爬的时候只看脚下的路,到了山顶回头看,才发现自己走了四个明显不同的阶段。
我把这条线叫"驾驭曲线"。
四个阶段
第一阶段:许愿式
最开始用 Agent 的时候,我的状态是"许愿"。
我给 Agent 一个宏大的目标——"帮我做一个完整的系统"——然后等着它给我结果。我对 Agent 的约束几乎为零:没有写"该做什么不该做什么",没有限定它的权限,没有定义什么叫"做好了"。
这个阶段的特征是:我把 Agent 当许愿池。 我扔进去一个愿望,等着它实现。如果实现了,我兴奋;如果没实现,我困惑。但无论是兴奋还是困惑,我都没有想过——问题可能出在"我许愿的方式"上。
第 3 章那个虚拟办公室的失败,就是这个阶段的典型。一份 390 行的调试计划、两天一把梭的代码、然后无尽的报错——我不知道问题出在"我给了 Agent 一个太大的、没有验证的交付单元"。
第二阶段:划边界
第一个项目失败之后,我学到了一件事:得先说清楚不做什么。
第二个项目里,我写了一份正式的 PRD,里面有一节叫"非目标"——明确列出"不做什么"。这是第一次主动给项目划边界。
技术选型也收敛了——能简单的就简单,能砍掉的复杂度就砍掉。
但这个阶段我还是没有真正"驾驭" Agent。我只是在约束自己——约束自己的野心,别什么都想要。我跟 Agent 的关系还是"我给目标,你执行",只不过目标小了一些。
第三阶段:驾驭式
真正的变化发生在后面几个项目。我开始意识到——要约束的不只是目标,还有 Agent 的行为方式。
这个阶段我做的事包括:
- 在项目的指令文件里写"开发哲学"——"架构是长出来的""宁可错过也不要打扰""透明可控"——第一次对 Agent 的行为做显式约束
- 把给 Agent 的权限从"全开"收紧到精确到具体命令的白名单
- 给交付拆阶段,每个阶段有可验证的体验效果
这个阶段的特征是:我不再只是给目标,我开始管理"Agent 怎么工作"。 指令文件从"系统说明书"变成了"工作指南"。权限从"你看着办"变成了"你能做什么我都列好了"。
第四阶段:元驾驭式
最后一个阶段是这份手记第四部分讲的双 Agent 协作——让一个 Agent 去驾驭另一个 Agent。
我不直接指挥开发 Agent 干活,而是让 PM Agent 去拆任务、调开发 Agent、验收产出。我只在关键节点出现——审批越界操作、重试失败后兜底。
这个阶段的特征是:我从"执行者/指挥官"变成了"架构师/守门员"。 我的注意力被释放了——不再逐条指挥,而是设计协作体系、定义边界、兜底关键节点。
四个阶段的标志
怎么判断你在哪个阶段?我看四个东西就够了:
| 标志 | 许愿式 | 划边界 | 驾驭式 | 元驾驭式 |
|---|---|---|---|---|
| 指令文件 | 系统说明书 / 没有 | 有边界 | 有行为约束 / 开发哲学 | 约束已内化为 Agent 系统 |
| 权限 | 全开 | 粗放 | 白名单、精确到命令 | 由 Agent 系统管理 |
| 交付方式 | 一次性大需求 | 有"非目标"清单 | 分阶段 + 每阶段可验证 | Agent 自己拆解 + 验收 |
| 人的角色 | 许愿 | 划边界 | 指挥官 | 架构师 / 审批者 |
有一个特别直观的物证可以帮你判断——看你给 Agent 的权限配置文件是怎么演进的。 我最早的权限是"什么都允许",后来变成"允许 Python 所有操作",再后来变成精确到具体命令的白名单,最后精确到连测试命令的参数都锁死。权限从粗放到精细的过程,就是驾驭能力升级的过程。
这条曲线不是线性的
跟第 2 章的"四阶认知"一样,这条驾驭曲线也不是线性的。
我不是"走完第一阶段再走第二阶段"这么整齐。我在第二阶段的项目里偶尔还会"许愿"(比如某个功能憋大招了),在第三阶段的项目里也尝试过"元驾驭"(比如让 Agent 调 CC)。真实的过程是螺旋的——大方向在升级,但时不时也会退回去。
所以不用纠结"我在第几阶段"。这四个阶段的价值是给你一面镜子——看看自己现在跟 Agent 的关系是什么模式,下一个阶段大概长什么样。
这份手记的定位
讲完驾驭曲线,可以回头说这份手记的定位了。
这份手记不是"Agent 工程教科书"。它不教你从零实现一个 Agent 框架,不覆盖所有技术栈,不追求知识的完整性。
它是一个程序员从"许愿式"走到"元驾驭式"的过程中,踩过的坑和提炼的经验。 每一章对应驾驭曲线上某个阶段的某个具体问题——harness 认知(第 1-2 章)、颗粒度失控(第 3 章)、工具设计(第 4 章)、循环简化(第 5 章)、eval 验证(第 6-7 章)、多 Agent 协作(第 8-10 章)、鲁棒性和质量门禁(第 11-12 章)。
如果你也在走这条路,希望这些经验能帮你少踩几个坑、少走两个项目的弯路。如果你走得比我远——比如已经在系统性地做 CI、做监控闭环、做超时重试熔断——那第五部分那些"我还没做到"的东西,正好是你的起点。
这一章的工具:你在哪个阶段?
🔧 驾驭阶段自检
诚实回答以下问题,看看你跟 Agent 的协作处于哪个阶段:
指令文件
- [ ] 你给 Agent 的指令文件里,有没有"禁止做什么"?
- [ ] 它是"系统说明书"(描述系统是什么)还是"工作指南"(告诉 Agent 怎么做)?
权限
- [ ] 你给 Agent 的权限是"什么都允许"还是精确到具体命令?
- [ ] 你有没有回头收紧过权限?(从粗放到精细的过程就是升级的过程)
交付方式
- [ ] 你的需求是"一次大块"还是"分阶段、每阶段可验证"?
- [ ] 每个交付单元有没有明确的"成了长什么样"?
人的角色
- [ ] 你是在逐条指挥 Agent,还是在设计 Agent 运转的系统?
- [ ] 你有没有让一个 Agent 去调用/监督另一个 Agent?
判断标准
- 四个都答"没有/前者" → 第一阶段(许愿式)
- 有边界了但还在逐条指挥 → 第二阶段(划边界)
- 开始约束 Agent 行为方式、权限精确化 → 第三阶段(驾驭式)
- 让 Agent 驾驭 Agent,人退到审批和兜底 → 第四阶段(元驾驭式)
小结
这是全文的最后一章正文。驾驭曲线四个阶段——许愿、划边界、驾驭、元驾驭——不是什么理论框架,是我自己走过的路。
回头看,这条路的核心变化就一个:人对 Agent 的控制方式,从"事后检查"逐渐前移到"事前设计"。 许愿式是"你做完了我就看看",划边界是"我先说清不做什么",驾驭式是"我设计好你该怎么工作",元驾驭式是"我设计好 Agent 之间怎么协作"。
每一级的提升,都是把控制点前移一步——从"出了问题再补"到"提前设计好不让问题出现"。这条路的终点在哪里?我现在也不知道。但我知道,每往前走一步,出的问题就越少,能做的事情就越多。
下一章是结语——聊聊这份手记没讲什么,以及我接下来想往哪走。
下一章
结语 —— 诚实的边界,以及未来的方向。