MODEL_CAPACITY_EXHAUSTED 错误完全解决
遇到 MODEL_CAPACITY_EXHAUSTED 错误?这是 Google Gemini API 的容量限制错误。本文详解其机制和解决方案。
什么是 MODEL_CAPACITY_EXHAUSTED?
这个错误码表示 Google 的 AI 模型服务器资源已耗尽,暂时无法接受新请求:
{
"error": {
"code": 429,
"message": "Resource has been exhausted",
"status": "RESOURCE_EXHAUSTED",
"details": [{"reason": "MODEL_CAPACITY_EXHAUSTED"}]
}
}
与普通 429 的区别
- 普通 429 Rate Limit:你个人的请求频率超限,等一会儿就好
- MODEL_CAPACITY_EXHAUSTED:服务器端全局容量问题,所有用户都受影响
常见触发场景
- 使用 Gemini CLI 或 Gemini API 时
- 高并发调用最新模型
- 免费额度用户在高峰期
- 某些地区的服务器集群容量不足
解决方案
智能重试策略
MODEL_CAPACITY_EXHAUSTED 是暂时性错误,最有效的方案是持续重试:
# 推荐:短间隔持续重试
import time
def robust_call(prompt, max_retries=60, interval=1):
for i in range(max_retries):
try:
return call_gemini(prompt)
except CapacityExhaustedError:
time.sleep(interval)
raise Exception("Capacity exhausted after retries")
中转站方案:AI API 中转站内置智能重试(最多 60 次,1秒间隔),自动处理 MODEL_CAPACITY_EXHAUSTED,用户完全无感知。
使用 AI Credit
Google 的 AI Credit(付费积分)可以获得更高的服务优先级,减少遇到容量限制的概率。中转站可以自动管理 AI Credit 的使用。
多账户分散
使用多个 Google 账户,通过中转站自动在不同账户间轮转请求,降低单账户触发限制的概率。
最佳实践
- 实现自动重试(推荐 1 秒间隔)
- 使用中转站的智能重试和多账户功能
- 关键业务场景准备备用模型
- 监控错误率,高峰期适当降低并发
轻舟 AI