Claude API 价格详解与省钱攻略
Claude API 按 Token 用量计费,不同模型价格差异显著。了解定价结构可以帮助你选择最合适的模型,并有效控制成本。
Claude 模型定价一览
Anthropic 目前提供三个主力模型系列,价格如下(单位:美元/百万 Token):
| 模型 | 输入价格 | 输出价格 | 上下文窗口 | 适用场景 |
|---|---|---|---|---|
| Claude Opus 4 | $15/MTok | $75/MTok | 200K | 复杂推理、代码架构 |
| Claude Sonnet 4 | $3/MTok | $15/MTok | 200K | 日常编码、写作、分析 |
| Claude Haiku 3.5 | $0.80/MTok | $4/MTok | 200K | 简单任务、分类、提取 |
提示:MTok = 百万 Token。1 百万 Token 大约等于 75 万个英文单词或 50 万个中文字符。
Token 计算方法
理解 Token 的计算方式对预估成本至关重要:
- 英文:1 个 Token 约 4 个字符,即 1000 个 Token ≈ 750 个单词
- 中文:1 个汉字通常占 1-2 个 Token
- 代码:Token 数量取决于代码结构,通常比纯文字多 20-50%
常见任务 Token 消耗
- 一次简单问答:输入约 100-500 Token,输出约 200-1000 Token
- 代码生成/修改:输入约 1000-5000 Token(含上下文),输出约 500-3000 Token
- 长文档分析:输入可达 50,000-100,000 Token,输出约 1000-5000 Token
- Claude Code 一次会话:通常消耗 10,000-100,000 Token
成本估算示例
场景一:个人开发者日常使用 Sonnet
每天约 50 次对话
平均每次:输入 2000 Token + 输出 1000 Token
月消耗:
输入:50 × 2000 × 30 = 3,000,000 Token = 3 MTok
输出:50 × 1000 × 30 = 1,500,000 Token = 1.5 MTok
月成本:3 × $3 + 1.5 × $15 = $9 + $22.5 = $31.5/月
场景二:使用 Claude Code 编程(Sonnet)
每天约 5 个编程会话
平均每次:输入 20,000 Token + 输出 5,000 Token
月消耗:
输入:5 × 20,000 × 22 = 2,200,000 Token = 2.2 MTok
输出:5 × 5,000 × 22 = 550,000 Token = 0.55 MTok
月成本:2.2 × $3 + 0.55 × $15 = $6.6 + $8.25 = $14.85/月
场景三:团队使用 Opus 做代码审查
5 人团队,每人每天 10 次审查
平均每次:输入 10,000 Token + 输出 3,000 Token
月消耗:
输入:5 × 10 × 10,000 × 22 = 11,000,000 Token = 11 MTok
输出:5 × 10 × 3,000 × 22 = 3,300,000 Token = 3.3 MTok
月成本:11 × $15 + 3.3 × $75 = $165 + $247.5 = $412.5/月
省钱技巧
- 选对模型:日常任务用 Sonnet,简单任务用 Haiku,只在需要深度推理时用 Opus
- 精简 Prompt:去掉冗余描述,直接给出明确指令,减少输入 Token
- 利用缓存:Anthropic 提供 Prompt Caching 功能,缓存命中价格仅为原价的 10%
- 控制输出长度:设置合理的
max_tokens,避免不必要的冗长回复 - 批量处理:使用 Batch API 批量发送请求,价格降低 50%
- 管理上下文:及时清理无关的对话历史,减少重复发送的 Token
Prompt Caching 优化
对于重复使用相同 System Prompt 或文档的场景,Prompt Caching 可以大幅降低成本:
# Python 示例:使用 Prompt Caching
response = client.messages.create(
model="claude-sonnet-4-20250514",
max_tokens=1024,
system=[{
"type": "text",
"text": "你是一个代码审查专家...(很长的系统提示)",
"cache_control": {"type": "ephemeral"}
}],
messages=[{"role": "user", "content": "请审查这段代码"}]
)
缓存命中时,输入价格降至原价的 10%,对于频繁使用长 System Prompt 的场景效果显著。
注意:Extended Thinking(深度思考)模式下,思考过程的 Token 也会计费,输入价格与常规输入相同,输出价格与常规输出相同。深度思考任务的 Token 消耗可能远超预期。
提示:通过轻舟 AI(claude4u.com)使用 Claude API,支持支付宝充值,按实际 Token 用量计费,透明定价,无隐藏收费。
轻舟 AI