Gemini API 价格详解
Google Gemini API 提供灵活的定价方案,包括免费额度和按量付费。本文详解各模型价格、免费额度限制,以及如何通过 AI Credit 降低使用成本。
免费额度
Gemini API 为所有开发者提供免费额度,适合学习和小型项目:
- Gemini 2.5 Flash:免费,每分钟 10 次请求
- Gemini 2.5 Pro:免费,每分钟 5 次请求
- Gemini 2.0 Flash:免费,每分钟 15 次请求
提示:免费额度的速率限制较低,适合开发调试。生产环境建议升级到付费方案或使用中转服务。
付费方案价格
Gemini 2.5 Pro
- 输入(≤200K token):$1.25 / 百万 token
- 输入(>200K token):$2.50 / 百万 token
- 输出:$10 / 百万 token
- 思考 token(thinking):$3.50 / 百万 token
Gemini 2.5 Flash
- 输入(≤200K token):$0.15 / 百万 token
- 输入(>200K token):$0.30 / 百万 token
- 输出:$0.60 / 百万 token
- 思考 token:$0.70 / 百万 token
Gemini 2.0 Flash
- 输入:$0.10 / 百万 token
- 输出:$0.40 / 百万 token
什么是 AI Credit?
Google 推出了 AI Credit 计划,为开发者提供免费或折扣额度:
- Google Cloud 新用户:$300 免费额度,可用于 Vertex AI
- AI Studio 免费方案:每日有一定的免费请求次数
- 学术/初创企业计划:可申请额外额度
如何计算费用?
Gemini API 按 token 计费。一个 token 大约等于 4 个英文字符或 1-2 个中文字符。
# 查看请求的 token 用量
from google import genai
client = genai.Client(api_key="YOUR_API_KEY")
response = client.models.generate_content(
model="gemini-2.5-flash",
contents="写一篇 500 字的文章"
)
# 查看 token 统计
usage = response.usage_metadata
print(f"输入 token: {usage.prompt_token_count}")
print(f"输出 token: {usage.candidates_token_count}")
print(f"总计 token: {usage.total_token_count}")
与其他模型价格对比
- Gemini 2.5 Flash vs GPT-4o-mini:Gemini 2.5 Flash 价格相近,但支持 100 万 token 上下文
- Gemini 2.5 Pro vs GPT-4o:Gemini 2.5 Pro 输入价格更低,性价比更高
- Gemini 2.5 Pro vs Claude Sonnet:Gemini 在长文本处理上有价格优势
通过中转服务优化成本
提示:轻舟 AI(claude4u.com)提供 Gemini API 中转服务,价格透明。支持预充值按量扣费,同时提供用量统计面板,帮助你精确控制 AI 使用成本。
使用中转服务的成本优势:
- 无需绑定 Google 国际支付方式,支持国内支付
- 多模型统一计费,方便对比和切换
- 实时用量监控,避免意外高额账单
- 内置自动重试,减少因 503 错误导致的无效花费
注意:Gemini API 的免费额度有严格的速率限制。如果你的应用需要稳定的高并发访问,建议直接使用付费方案或 claude4u.com 中转服务。
轻舟 AI