一句话解释
Guardrail 是限制 AI 行动范围和拦截危险输出的规则。
小白比喻
高速公路护栏不是让车变慢,而是防止冲出悬崖。
第一性原理
越有执行能力的系统,越需要明确禁止条件。
为什么 AI Coding 时代必须懂
Codex 或 agent 可能误解目标,guardrail 能阻止越权、泄密和危险副作用。
商业项目事故
AI 为解决权限报错,建议关闭鉴权中间件。
指挥 Codex 时应该怎么问
请为这个任务列出 guardrails:禁止改哪些文件、禁止绕过哪些安全规则。 任务卡里应该怎么写
写明不可做事项、敏感数据、权限上限和需要人工确认的操作。
验收标准怎么写
实现没有绕过安全规则,危险操作被拒绝或要求确认。
错误指令
只要功能能跑就行。
合格指令
不得关闭鉴权;如权限导致测试失败,应创建最小测试用户或 mock。