概述
本文为您提供 Azure OpenAI 服务的配额和限制的全面指南,帮助您更好地理解和管理资源使用。
访问不同区域的技术文档
您正在访问 Microsoft Azure Global Edition 技术文档网站。如需访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
默认配额和限制
下表列出了 Azure OpenAI 服务的默认配额和限制:
| 限制名称 | 限制值 |
| — | — |
| 每个 Azure 订阅每个区域的 Azure OpenAI 资源 | 30 |
| 默认 DALL-E 2 配额限制 | 2 个并发请求 |
| 默认 DALL-E 3 配额限制 | 2 个容量单位(每分钟 6 个请求) |
| 默认 Whisper 配额限制 | 每分钟 3 个请求 |
| 每个请求的最大提示令牌数 | 每个模型不同 |
| 每个资源的最大标准部署数 | 32 |
| 最大微调模型部署 | 5 |
| 每个资源的训练作业总数 | 100 |
| 每个资源同时运行的最大训练作业数 | 1 |
| 排队的最大训练作业数 | 20 |
| 每个资源的最大文件数(优调) | 50 |
| 每个资源的所有文件的总大小(优调) | 1 GB |
| 最大训练作业时间(如果超过,作业将失败) | 720 小时 |
| 最大训练作业大小(训练文件中的标记数)×(时期数) | 20 亿 |
| 每次上传的所有文件的最大大小(数据上的 Azure OpenAI) | 16 MB |
| 数组中具有 /embeddings
的最大输入数 | 2048 |
| 最大 /chat/completions
消息数 | 2048 |
| 最大 /chat/completions
函数数 | 128 |
| 最大 /chat completions
工具数 | 128 |
| 每个部署预配的吞吐量单位数上限 | 100,000 |
| 每个助手/线程的最大文件数 | 使用 API 或 Azure AI Foundry 门户时为 10,000。在 Azure OpenAI Studio 中,限制为 20。 |
| 助手和微调的最大文件大小 | 512 MB(通过 Azure AI Foundry 门户 200 MB) |
| 助手的所有上传文件的最大大小 | 100 GB |
| 助手令牌限制 | 令牌限制 2,000,000 |
Batch 限制
| 限制名称 | 限制值 |
| — | — |
| 每个资源的最大文件数 | 500 |
| 最大输入文件大小 | 200 MB |
| 每个文件的最大请求数 | 100,000 |
批处理配额
全局批处理
| 型号 | 企业协议 | 默认 | 基于信用卡的每月订阅 | MSDN 订阅 | 面向学生的 Azure 免费试用版 |
| — | — | — | — | — | — |
| gpt-4o
| 5 B | 200 M | 50 M | 90 K | 空值 |
| gpt-4o-mini
| 15 B | 1 B | 50 M | 90 K | 空值 |
B = 十亿 | M = 百万 | K = 千
其他套餐类型
某些套餐类型可能限制最大配额值。
保持在速率限制范围内的一般最佳做法
- 在应用程序中实现重试逻辑
- 避免工作负载的急剧变化。逐步增大工作负载。
- 测试不同负载增加模式。
- 增加分配给部署的配额。如有必要,从另一个部署中移动配额。
如何请求增加配额
可以通过配额增加请求表单提交配额增加请求。
后续步骤
探索如何管理 Azure OpenAI 部署的配额。
详细了解为 Azure OpenAI 提供支持的基础模型。