这一课解决什么
借 SICP 元语言抽象解释 AI Agent:Runtime 读取目标,在环境中求值,调用工具,写回状态,直到满足停止条件。
小白比喻
Agent runtime 像一套游戏规则:玩家能做什么、何时行动、如何判胜负,都由规则决定。
第一性原理
- 语言的意义来自求值规则,Agent 的行为来自 runtime 规则。
- 多 agent 不是越多越强,而是是否需要不同环境、权限和评价规则。
- Guardrail 是规则的一部分,不是事后补丁。
指挥 Codex 的动作
- 为 agent 定义环境、工具、记忆、停止条件和 guardrail。
- 要求 trace 记录每次求值过程。
- 拒绝没有权限边界和合并规则的多 agent 设计。
练习
把一个“AI 客服”拆成 Runtime 循环:输入、环境、工具、状态、停止条件。
相关概念
Agent Runtime Agent Runtime 是让 AI 按规则读取目标、选择动作、调用工具、写回状态并判断停止的运行器。 环境 环境是一次 AI 或程序求值时可见的上下文、状态、工具和规则。 Tool Schema Tool Schema 是 AI 调用工具时必须遵守的参数和返回契约。 Memory Memory 是 AI 系统跨轮次保留的信息和偏好。 Guardrail Guardrail 是限制 AI 行动范围和拦截危险输出的规则。 Trace Trace 是一次执行从输入到输出经过了哪些步骤、工具和状态的轨迹。 Replay Replay 是用记录下来的输入、状态和工具返回重放一次执行。