一句话解释
性能预算是系统在速度、资源和成本上必须守住的上限。
小白比喻
装修预算不只是总价,也包括工期、材料和返工成本。
第一性原理
没有预算,优化没有方向;超预算,功能再对也可能不可用。
为什么 AI Coding 时代必须懂
AI 不需要像人类偷懒省 token,但商业项目仍要控制延迟、API 调用和运行成本。
商业项目事故
每个用户请求触发 20 次模型调用,成本超过收入。
指挥 Codex 时应该怎么问
请估算这个方案的延迟和成本,并给出性能预算与降本方案。 任务卡里应该怎么写
写清楚 p95 延迟、最大请求数、token/API 成本和资源限制。
验收标准怎么写
在目标流量下成本和性能都不超过预算。
错误指令
效果最好就行,成本以后再管。
合格指令
优先充分上下文完成任务,但重复资料要压缩,批量分析要分阶段评估成本。