Gemini API 入门教程
Google Gemini API 提供强大的多模态 AI 能力。本文从零开始,教你获取 API Key、发起第一次调用、使用流式输出和多模态功能。
Gemini API 概述
Gemini 是 Google 推出的新一代 AI 模型,支持文本、图像、音频和视频的多模态理解。目前主要模型包括:
- Gemini 2.5 Pro:最强推理能力,支持 100 万 token 上下文
- Gemini 2.5 Flash:速度与质量的最佳平衡
- Gemini 2.0 Flash:超快响应,适合高并发场景
获取 API Key
- 访问 Google AI Studio(
aistudio.google.com) - 使用 Google 账户登录
- 点击 Get API Key → Create API Key
- 选择或创建一个 Google Cloud 项目
- 复制生成的 API Key
提示:Gemini API 提供免费额度,每分钟最多 15 次请求(2.5 Pro),适合学习和小规模使用。
第一次 API 调用
Python SDK
pip install google-genai
from google import genai
client = genai.Client(api_key="YOUR_API_KEY")
response = client.models.generate_content(
model="gemini-2.5-flash",
contents="用一句话介绍量子计算"
)
print(response.text)
cURL 调用
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash:generateContent?key=YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{"contents":[{"parts":[{"text":"你好"}]}]}'
流式输出
流式输出可以让用户更快看到响应,提升体验:
from google import genai
client = genai.Client(api_key="YOUR_API_KEY")
for chunk in client.models.generate_content_stream(
model="gemini-2.5-flash",
contents="写一首关于春天的诗"
):
print(chunk.text, end="")
多模态调用
Gemini 支持图像理解,可以分析图片内容:
from google import genai
from google.genai import types
client = genai.Client(api_key="YOUR_API_KEY")
# 使用图片 URL
response = client.models.generate_content(
model="gemini-2.5-flash",
contents=[
types.Part.from_uri(
file_uri="https://example.com/image.jpg",
mime_type="image/jpeg"
),
"描述这张图片的内容"
]
)
print(response.text)
国内使用 Gemini API
由于网络限制,国内直接调用 Gemini API 可能不稳定。推荐使用中转服务:
提示:轻舟 AI(claude4u.com)支持 Gemini API 中转,提供 OpenAI 兼容格式接口。国内直连,同时自动处理 503 过载错误。
# 通过 OpenAI 兼容接口调用 Gemini
from openai import OpenAI
client = OpenAI(
api_key="your-relay-key",
base_url="https://claude4u.com/v1"
)
response = client.chat.completions.create(
model="gemini-2.5-flash",
messages=[{"role": "user", "content": "你好"}]
)
print(response.choices[0].message.content)
轻舟 AI