Skip to content

附录 C · 术语表

这份手记里用到的术语,按首次出现顺序排列。每个术语给一句话解释,不展开。

Agent(智能体) 以 LLM 为决策核心、能调用工具、能多轮交互的程序。

Harness(脚手架) 模型之外的一切——工具定义、编排逻辑、上下文管理、错误处理、验证循环。详见第 1 章。

Prompt Engineering(提示工程) 怎么跟模型说话——写指令、加示例、控制输出格式。认知四阶的第一阶。

Context Engineering(上下文工程) 给模型什么信息——管理模型每次决策时能看到的内容。认知四阶的第二阶。

Loop Engineering(循环工程) 执行循环怎么设计——用状态机还是自决循环、触发和响应怎么分。认知四阶的第四阶。

few-shot(少样本示例) 在提示词里给模型看几个"输入→正确输出"的范例,让它照着学。

ReAct 一种 Agent 循环模式:模型思考 → 调工具 → 拿到结果 → 再思考。本书讲的"简单循环"基本都是 ReAct。

颗粒度 交付单元的大小。一次性交付整个系统是颗粒度大,分阶段交付是颗粒度小。详见第 3 章。

eval(评测) 给 Agent 一个输入,对它的输出应用打分逻辑,衡量成功与否。详见第 6 章。

eval-driven(评测驱动) 开发 Agent 功能前,先写 eval 用例定义"成功长什么样",再开发直到通过。Agent 时代的 TDD。

LLM-as-Judge(LLM 裁判) 用一个独立的 LLM 来评判另一个 Agent 的输出质量。灵活但自身也不稳定。详见第 6-7 章。

代码断言 用代码检查可量化的结果(如记忆条数对不对、有没有触发),是 eval 的一种打分手段。

通过率阈值 eval 的判定标准——跑多次,通过率达到一定比例(如 80%)才算通过。应对非确定性的核心策略。详见第 7 章。

supersedes_id(替代关系) 记忆更新的一种机制——新建一条记忆指向旧记忆,表示替代关系。第 4 章的开篇故事围绕它展开。

plan.md 双 Agent 协作中,PM Agent 写给开发 Agent 的任务计划文件。第 9 章的核心设计之一。

合成触发(synthetic trigger) 开发 Agent 完成任务后,引擎构造一条新消息喂回 PM Agent,让它重新构建上下文并通知用户。详见第 9 章。

边界感知权限 开发 Agent 在工作区内的操作自动批准,越界操作推送给人审批。详见第 9 章。

驾驭曲线 人和 Agent 协作关系的四个阶段:许愿 → 划边界 → 驾驭 → 元驾驭。详见第 13 章。

CI(持续集成) 每次提交代码自动跑测试和检查的机制。第 12 章讲的是"我所有项目都没有 CI"的反例。

熔断 外部调用连续失败 N 次后,一段时间内不再调用,直接返回降级响应。第 11 章讲了我没做熔断导致系统空转一整夜的故事。