附录 C · 术语表

这份手记里用到的术语，按首次出现顺序排列。每个术语给一句话解释，不展开。

Agent（智能体） 以 LLM 为决策核心、能调用工具、能多轮交互的程序。

Harness（脚手架） 模型之外的一切——工具定义、编排逻辑、上下文管理、错误处理、验证循环。详见第 1 章。

Prompt Engineering（提示工程） 怎么跟模型说话——写指令、加示例、控制输出格式。认知四阶的第一阶。

Context Engineering（上下文工程） 给模型什么信息——管理模型每次决策时能看到的内容。认知四阶的第二阶。

Loop Engineering（循环工程） 执行循环怎么设计——用状态机还是自决循环、触发和响应怎么分。认知四阶的第四阶。

few-shot（少样本示例） 在提示词里给模型看几个"输入→正确输出"的范例，让它照着学。

ReAct 一种 Agent 循环模式：模型思考 → 调工具 → 拿到结果 → 再思考。本书讲的"简单循环"基本都是 ReAct。

颗粒度 交付单元的大小。一次性交付整个系统是颗粒度大，分阶段交付是颗粒度小。详见第 3 章。

eval（评测） 给 Agent 一个输入，对它的输出应用打分逻辑，衡量成功与否。详见第 6 章。

eval-driven（评测驱动） 开发 Agent 功能前，先写 eval 用例定义"成功长什么样"，再开发直到通过。Agent 时代的 TDD。

LLM-as-Judge（LLM 裁判） 用一个独立的 LLM 来评判另一个 Agent 的输出质量。灵活但自身也不稳定。详见第 6-7 章。

代码断言 用代码检查可量化的结果（如记忆条数对不对、有没有触发），是 eval 的一种打分手段。

通过率阈值 eval 的判定标准——跑多次，通过率达到一定比例（如 80%）才算通过。应对非确定性的核心策略。详见第 7 章。

supersedes_id（替代关系） 记忆更新的一种机制——新建一条记忆指向旧记忆，表示替代关系。第 4 章的开篇故事围绕它展开。

plan.md 双 Agent 协作中，PM Agent 写给开发 Agent 的任务计划文件。第 9 章的核心设计之一。

合成触发（synthetic trigger） 开发 Agent 完成任务后，引擎构造一条新消息喂回 PM Agent，让它重新构建上下文并通知用户。详见第 9 章。

边界感知权限 开发 Agent 在工作区内的操作自动批准，越界操作推送给人审批。详见第 9 章。

驾驭曲线 人和 Agent 协作关系的四个阶段：许愿 → 划边界 → 驾驭 → 元驾驭。详见第 13 章。

CI（持续集成） 每次提交代码自动跑测试和检查的机制。第 12 章讲的是"我所有项目都没有 CI"的反例。

熔断外部调用连续失败 N 次后，一段时间内不再调用，直接返回降级响应。第 11 章讲了我没做熔断导致系统空转一整夜的故事。