从 API 密钥预算升级到工作区预算现有 API 密钥月预算继续保留,Spend & Billing 增加工作区层预算、单次请求最大成本和模型允许 / 禁用策略。预算命中时返回清晰的 402/429,并附带剩余额度响应头。模型允许名单 / 禁用名单按工作区继承到请求执行。日限和单次请求成本上限防止异常流量扩大损失。
成本归因默认进入账本客户可以通过请求头或请求 metadata 传入 customer_id 和 feature,用于用量、账单和异常复核。支持 X-BatchIn-Customer-Id 与 X-BatchIn-Feature。归因字段进入 UsageLog 和 billing metadata。异常提醒基于预算、增长率和模型切换信号。