Claude Opus 4.8 已在 BUZZ 上线:模型名、价格与迁移指南
Claude Opus 4.8 现在可以通过 BUZZ AI Gateway 调用了。你不需要新账号、新端点或新密钥 —— 把模型字符串改成 claude-opus-4-8,你就用上了最新的 Opus。本文讲清楚精确的标识符、按量计费的价格、版本升级后 prompt 缓存的行为,以及切换时唯一需要留意的一点。
模型标识符
模型名是 claude-opus-4-8。和每一个 Claude 模型一样,Anthropic 使用连字符而非小数点 —— claude-opus-4.8 不是合法标识符,会返回 404 model not found。如果你切换后看到这个错误,先检查是不是多打了一个点。
BUZZ 在它已经提供的两个接口上都暴露了 Opus 4.8:
- Anthropic Messages:
https://buzzai.cc/v1/messages—— Claude Code 和官方anthropicSDK 使用。 - OpenAI 兼容:
https://buzzai.cc/v1/chat/completions——openaiSDK 以及任何讲 chat.completions 结构的工具使用。
完整的实时模型列表始终发布在 https://buzzai.cc/models。只要名字出现在那里,你的密钥就能调用它。
如何调用
Anthropic Messages(curl):
curl https://buzzai.cc/v1/messages \
-H "x-api-key: $BUZZ_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "content-type: application/json" \
-d '{
"model": "claude-opus-4-8",
"max_tokens": 1024,
"messages": [{"role": "user", "content": "用两句话解释 B 树。"}]
}'
OpenAI SDK(Python)—— 相比标准 OpenAI 调用,只有 base_url 和 model 不同:
from openai import OpenAI
client = OpenAI(
base_url="https://buzzai.cc/v1",
api_key="YOUR_BUZZ_KEY",
)
resp = client.chat.completions.create(
model="claude-opus-4-8",
messages=[{"role": "user", "content": "用两句话解释 B 树。"}],
)
print(resp.choices[0].message.content)
Claude Code —— 把它指向 BUZZ 一次,然后像选其他模型一样选 Opus 4.8:
export ANTHROPIC_BASE_URL=https://buzzai.cc
export ANTHROPIC_AUTH_TOKEN=YOUR_BUZZ_KEY
# 然后在 Claude Code 的模型选择器里选 claude-opus-4-8
价格
Opus 4.8 采用纯按量计费,无月费、无最低消费,和 BUZZ 上其他所有模型一致。
| 模型 | 输入 / 百万 | 输出 / 百万 |
|---|---|---|
| Claude Opus 4.8 | $0.20 | $1.00 |
| Claude Sonnet 4.6 | $0.12 | $0.60 |
| Claude Haiku 4.5 | $0.04 | $0.20 |
prompt 缓存的读写按 Anthropic 官方折扣倍率自动计费。在拥有稳定、可复用前缀的工作负载上 —— 长系统提示、大型工具 schema、检索到的文档 —— 实际输入成本会远低于标价,因为大部分前缀是以缓存读取而非新输入的方式被处理的。如何组织请求才能真正命中缓存,见 prompt 缓存实战手册。
从 4.7 升级:几乎什么都不用改
这次版本升级刻意做得很无聊。下面是你需要改动的全部内容:
| 关注点 | 需要的改动 |
|---|---|
| 模型字符串 | claude-opus-4-7 → claude-opus-4-8 |
| 端点 / base URL | 无 |
| API 密钥 | 无 |
| 请求 / 响应结构 | 无 |
prompt 缓存标记(cache_control) | 无 |
| 工具调用 / function calling 块 | 无 |
| 流式(SSE)处理 | 无 |
唯一需要留意的:缓存预热
prompt 缓存条目按模型隔离。你在 claude-opus-4-7 下缓存的前缀,不会带到 claude-opus-4-8 —— 新模型上的第一个请求是一次缓存未命中,会为该前缀支付完整的输入价格。这次预热之后,新模型上的缓存读取恢复正常。
实际影响:如果你在 4.7 和 4.8 之间做 A/B,两边各自维护缓存,所以要为两次预热而非一次做预算。要干净切换,直接把所有地方的模型字符串一次性改掉,接受一次预热周期即可。
如果你在会话中途切换模型,发现某一两个请求的 cache_read_input_tokens 掉到零,那是预期内的。随着新模型的缓存填充,它会回升。
什么时候用 Opus 4.8,什么时候用 Sonnet 4.6
Opus 是重量级:更深的推理、更擅长长链路多步 agentic 循环、在困难的代码和分析上更强。Sonnet 4.6 大约是输入价格的五分之一,是大多数聊天、起草和日常编码的合适默认值。一个常见的生产模式是把大部分流量路由到 Sonnet,只把困难请求升级到 Opus 4.8 —— 而因为 BUZZ 对两者使用同一把密钥、同一个端点,这个路由只是你自己代码里的一个字符串,而不是第二套集成。
Q1:Claude Opus 4.8 的模型标识符是什么?
是 claude-opus-4-8。连字符,不是小数点 —— claude-opus-4.8 会返回 404。把它作为 model 参数传给 https://buzzai.cc/v1(OpenAI 兼容)或 https://buzzai.cc(Anthropic Messages)。
Q2:从 4.7 升级需要改什么?
只需改 model 字符串。端点、密钥、请求结构、prompt 缓存标记、工具调用块全部不变。把 claude-opus-4-7 替换为 claude-opus-4-8 即可。
Q3:Opus 4.8 多少钱?
按量计费,无月费、无最低消费。输入每百万 token $0.20,输出每百万 token $1.00。prompt 缓存命中按 Anthropic 官方折扣倍率自动计费。
Q4:prompt 缓存对 Opus 4.8 生效吗?
生效,使用与当前 Claude 系列相同的 cache_control 标记。缓存按模型隔离,所以从 4.7 切换后预期会有一次预热。
Q5:可以用 OpenAI SDK 调用 Opus 4.8 吗?
可以。把 base_url 设为 "https://buzzai.cc/v1",api_key 设为你的 BUZZ 密钥,传 model="claude-opus-4-8"。同一个调用 gpt-5 的 openai 客户端,改两个字符串即可调用 Opus 4.8。
最近校订:2026-05-29