一句话解释

Evaluation 是用标准评价输出好坏的过程,不是凭感觉夸一句不错。

小白比喻

试菜要看咸淡、温度、摆盘和出餐时间,而不是只问厨师满意不满意。

第一性原理

可改进系统必须有评价函数;评价越清楚,迭代越稳定。

为什么 AI Coding 时代必须懂

Evaluator-Optimizer 工作流能让 Codex 生成、检查、修正,而不是一次性押宝。

商业项目事故

AI 写出的文档很长,但没有覆盖权限和回滚,读起来漂亮却不能交付。

指挥 Codex 时应该怎么问

请先按验收标准评价当前实现,列出未达标项,再修复。

任务卡里应该怎么写

写清楚评价维度、权重、必须通过项和允许延期项。

验收标准怎么写

每轮迭代都有评分或通过/失败记录,缺陷被回写为下一步任务。

错误指令

再优化一下。

合格指令

按可用性、权限、错误处理、移动端、测试覆盖五项评分并修到全通过。

哪些课程会用到它