一句话解释

Guardrail 是限制 AI 行动范围和拦截危险输出的规则。

小白比喻

高速公路护栏不是让车变慢,而是防止冲出悬崖。

第一性原理

越有执行能力的系统,越需要明确禁止条件。

为什么 AI Coding 时代必须懂

Codex 或 agent 可能误解目标,guardrail 能阻止越权、泄密和危险副作用。

商业项目事故

AI 为解决权限报错,建议关闭鉴权中间件。

指挥 Codex 时应该怎么问

请为这个任务列出 guardrails:禁止改哪些文件、禁止绕过哪些安全规则。

任务卡里应该怎么写

写明不可做事项、敏感数据、权限上限和需要人工确认的操作。

验收标准怎么写

实现没有绕过安全规则,危险操作被拒绝或要求确认。

错误指令

只要功能能跑就行。

合格指令

不得关闭鉴权;如权限导致测试失败,应创建最小测试用户或 mock。

哪些课程会用到它