一句话解释
Evaluation 是用标准评价输出好坏的过程,不是凭感觉夸一句不错。
小白比喻
试菜要看咸淡、温度、摆盘和出餐时间,而不是只问厨师满意不满意。
第一性原理
可改进系统必须有评价函数;评价越清楚,迭代越稳定。
为什么 AI Coding 时代必须懂
Evaluator-Optimizer 工作流能让 Codex 生成、检查、修正,而不是一次性押宝。
商业项目事故
AI 写出的文档很长,但没有覆盖权限和回滚,读起来漂亮却不能交付。
指挥 Codex 时应该怎么问
请先按验收标准评价当前实现,列出未达标项,再修复。 任务卡里应该怎么写
写清楚评价维度、权重、必须通过项和允许延期项。
验收标准怎么写
每轮迭代都有评分或通过/失败记录,缺陷被回写为下一步任务。
错误指令
再优化一下。
合格指令
按可用性、权限、错误处理、移动端、测试覆盖五项评分并修到全通过。