注意:由于定价和限制会随时间变化,本文仅供撰写当前时间参考。
核心术语
- RPM(requests per minute):每分钟请求次数
- RPD(requests per day):每天请求次数
- TPM(tokens per minute):每分钟 Token 数
- TPD(tokens per day):每天 Token 数
可以通过 OpenAI Tokenizer 查询文本对应的 token 数。值得注意的是,text-embedding-ada-002
、gpt-3.5
和 gpt-4
的词表均为 cl100k_base
。如果仅需向量化功能,选择价格更低的 text-embedding-ada-002
是明智之选。
OpenAI API
OpenAI 会根据付费情况动态调整配额,付费超过 $5 后,配额会显著增加:
| 模型 | 输入成本 | 输出成本 | RPM | RPD | TPM |
|—————————–|———-|———-|——|——|——|
| gpt-3.5-turbo-1106 | $0.0010 | $0.0020 | 3500 | 10000| 60K |
| gpt-3.5-turbo-instruct | $0.0015 | $0.0020 | 3500 | 10000| 60K |
| gpt-4 | $0.03 | $0.06 | 500 | 10000| 10K |
| gpt-4-32k | $0.06 | $0.12 | 500 | 10000| 10K |
Azure OpenAI API
不同区域的价格和限制有所不同,以下以 East US 2 为例:
| 模型 | 上下文大小 | 输入成本(每千 token) | 输出成本(每千 token) | TPM |
|—————-|————|————————|————————|——-|
| GPT-3.5-Turbo | 4K | $0.0015 | $0.002 | 300K |
| GPT-3.5-Turbo | 16K | $0.003 | $0.004 | 300K |
| GPT-4 | 8K | $0.03 | $0.06 | 40K |
| GPT-4 | 32K | $0.06 | $0.12 | 80K |
参考链接:
Azure OpenAI 限流
调用 Azure OpenAI API 的常见问题
404 Resource Not Found
如果请求中设置的 API 版本不正确,会返回 404 错误。目前可用的 API 版本包括:
- 2022-12-01
- 2023-03-15-preview
- 2023-05-15
- 2023-06-01-preview
- 2023-07-01-preview
- 2023-08-01-preview
- 2023-09-01-preview
Unsupported data type
Azure OpenAI API 的接口格式应为:https://{your-resource-name}.openai.azure.com/openai/deployments/{deployment-id}/completions?api-version={api-version}
如果使用 chat/completions
路径(即 URL 中包含 chat
),则会返回 Unsupported data type 错误。
限制优化策略
应用侧
- 增加重试逻辑
- 分散请求时间,避免集中请求
部署侧
- Azure:部署多个相同模型
- OpenAI:注册多个账号
- 使用代理池,分散请求到多个 API Key
总结
- 账号获取:OpenAI 提供免费额度,但需国外信用卡支付超出部分;Azure OpenAI 按需计费,开通 GPT-4 需单独申请。
- 价格:OpenAI API 略低于 Azure OpenAI API,批量购买 OpenAI 账号成本更低。
- 请求限制:免费 OpenAI API 限制更多,需构建代理池;Azure OpenAI 配额更宽松。
- 网络:OpenAI 需国际网络代理,Azure OpenAI 国内可直接访问。
建议:
– 生产环境:优先选用 Azure OpenAI API。
– 开发测试:可使用 OpenAI API。
– 成本敏感场景:可尝试构建 OpenAI API 代理池。