一句话解释
Replay 是用记录下来的输入、状态和工具返回重放一次执行。
小白比喻
看行车记录仪复盘事故,而不是凭司机回忆。
第一性原理
能回放,才能解释;能解释,才能修复。
为什么 AI Coding 时代必须懂
AI 系统受状态影响大,不能回放就很难知道为什么这次错。
商业项目事故
用户投诉 AI 给出错误报价,但系统没有保存检索证据和工具返回。
指挥 Codex 时应该怎么问
请设计 replay 数据结构,让这类失败可以离线重现。 任务卡里应该怎么写
保存模型版本、prompt、上下文、工具返回、随机性设置和输出。
验收标准怎么写
用同一 replay 记录能复现或解释原始结果差异。
错误指令
用户说错了就再问一次模型。
合格指令
记录完整执行包,支持离线评估和回归测试。