OpenAI API 价格详解

OpenAI API 按 Token 用量计费,不同模型价格差异显著。本文详细列出各模型的定价、费用计算方法和省钱策略,帮你合理控制 AI 开发成本。

GPT 系列定价(每百万 Token)

GPT-4o

GPT-4o mini

GPT-4 Turbo

o1(推理模型)

o3-mini(推理模型)

Embedding 模型定价

图像生成定价(每张)

费用计算示例

from openai import OpenAI

client = OpenAI(
    api_key="your-api-key",
    base_url="https://claude4u.com/v1"
)

response = client.chat.completions.create(
    model="gpt-4o",
    messages=[{"role": "user", "content": "写一篇500字的文章"}]
)

usage = response.usage
input_tokens = usage.prompt_tokens
output_tokens = usage.completion_tokens

# GPT-4o 费率
input_cost = input_tokens / 1_000_000 * 2.50
output_cost = output_tokens / 1_000_000 * 10.00
total_cost = input_cost + output_cost

print(f"输入 Token: {input_tokens}")
print(f"输出 Token: {output_tokens}")
print(f"输入费用: ${input_cost:.6f}")
print(f"输出费用: ${output_cost:.6f}")
print(f"总费用: ${total_cost:.6f}")

各模型性价比对比

根据不同场景选择最具性价比的模型:

省钱策略

1. 选择合适的模型

不是所有任务都需要最强模型。GPT-4o mini 对于大多数日常任务已经足够,价格仅为 GPT-4o 的 1/16。

2. 优化 Prompt 长度

# 优化前:冗长的 system prompt(约 500 token)
system_bad = "你是一个非常专业的、经验极其丰富的高级 Python 软件开发工程师..."

# 优化后:精简 system prompt(约 30 token)
system_good = "你是 Python 专家。回答简洁,附代码示例。"

3. 使用 Prompt 缓存

对于重复的长 System Prompt 或上下文,OpenAI 支持自动 Prompt 缓存,缓存命中的输入 token 费用减半。

4. 使用 Batch API

非实时任务使用 Batch API 可享受 50% 折扣。

5. 控制输出长度

# 限制输出 token 数
response = client.chat.completions.create(
    model="gpt-4o",
    max_tokens=256,  # 限制输出长度
    messages=[{"role": "user", "content": "简单解释什么是 REST API"}]
)

6. 管理对话历史

提示:通过 claude4u.com 轻舟 AI 中转服务,管理后台提供详细的费用统计面板,支持按 API Key、模型、时间维度分析用量。还可以设置费用预警和额度限制,避免意外超支。

月度费用估算

以下是典型使用场景的月度费用参考(基于 GPT-4o):

注意:以上价格以 OpenAI 官方定价为准,可能随时调整。使用中转服务的实际价格可能有所不同,请参考中转站定价页面了解最新费率。

Start Using 轻舟 AI

Stable, fast AI API relay — supports Claude, OpenAI, Gemini and more

Sign Up Now