Agent Runtime 是解释器 | AI Coding 指挥官训练

这一课解决什么

借 SICP 元语言抽象解释 AI Agent：Runtime 读取目标，在环境中求值，调用工具，写回状态，直到满足停止条件。

小白比喻

Agent runtime 像一套游戏规则：玩家能做什么、何时行动、如何判胜负，都由规则决定。

第一性原理

语言的意义来自求值规则，Agent 的行为来自 runtime 规则。
多 agent 不是越多越强，而是是否需要不同环境、权限和评价规则。
Guardrail 是规则的一部分，不是事后补丁。

指挥 Codex 的动作

为 agent 定义环境、工具、记忆、停止条件和 guardrail。
要求 trace 记录每次求值过程。
拒绝没有权限边界和合并规则的多 agent 设计。

练习

把一个“AI 客服”拆成 Runtime 循环：输入、环境、工具、状态、停止条件。

相关概念

Agent Runtime Agent Runtime 是让 AI 按规则读取目标、选择动作、调用工具、写回状态并判断停止的运行器。环境环境是一次 AI 或程序求值时可见的上下文、状态、工具和规则。 Tool Schema Tool Schema 是 AI 调用工具时必须遵守的参数和返回契约。 Memory Memory 是 AI 系统跨轮次保留的信息和偏好。 Guardrail Guardrail 是限制 AI 行动范围和拦截危险输出的规则。 Trace Trace 是一次执行从输入到输出经过了哪些步骤、工具和状态的轨迹。 Replay Replay 是用记录下来的输入、状态和工具返回重放一次执行。