Spend & Billing

把 AI 成本、预算和对账放在同一个账单入口

不只看模型调用次数,还要看每个 API 密钥、客户、功能和模型的花费,并能提前设置上限。

工作区

月预算

API 密钥

预算 / 日限

请求

最大成本

归因

customer_id / feature

从 API 密钥预算升级到工作区预算

现有 API 密钥月预算继续保留,Spend & Billing 增加工作区层预算、单次请求最大成本和模型允许 / 禁用策略。

  • 预算命中时返回清晰的 402/429,并附带剩余额度响应头。
  • 模型允许名单 / 禁用名单按工作区继承到请求执行。
  • 日限和单次请求成本上限防止异常流量扩大损失。

成本归因默认进入账本

客户可以通过请求头或请求 metadata 传入 customer_id 和 feature,用于用量、账单和异常复核。

  • 支持 X-BatchIn-Customer-Id 与 X-BatchIn-Feature。
  • 归因字段进入 UsageLog 和 billing metadata。
  • 异常提醒基于预算、增长率和模型切换信号。