BUZZ AI Gateway
首页 · 博客 · Claude Opus 4.8 已上线

Claude Opus 4.8 已在 BUZZ 上线:模型名、价格与迁移指南

Claude Opus 4.8 现在可以通过 BUZZ AI Gateway 调用了。你不需要新账号、新端点或新密钥 —— 把模型字符串改成 claude-opus-4-8,你就用上了最新的 Opus。本文讲清楚精确的标识符、按量计费的价格、版本升级后 prompt 缓存的行为,以及切换时唯一需要留意的一点。

发布于 2026-05-29 · 阅读时间约 6 分钟

claude-opus-4-8模型标识符
$0.20输入 / 百万 token
$1.00输出 / 百万 token
0 改动端点与密钥

模型标识符

模型名是 claude-opus-4-8。和每一个 Claude 模型一样,Anthropic 使用连字符而非小数点 —— claude-opus-4.8 不是合法标识符,会返回 404 model not found。如果你切换后看到这个错误,先检查是不是多打了一个点。

BUZZ 在它已经提供的两个接口上都暴露了 Opus 4.8:

完整的实时模型列表始终发布在 https://buzzai.cc/models。只要名字出现在那里,你的密钥就能调用它。

如何调用

Anthropic Messages(curl):

curl https://buzzai.cc/v1/messages \
  -H "x-api-key: $BUZZ_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "content-type: application/json" \
  -d '{
    "model": "claude-opus-4-8",
    "max_tokens": 1024,
    "messages": [{"role": "user", "content": "用两句话解释 B 树。"}]
  }'

OpenAI SDK(Python)—— 相比标准 OpenAI 调用,只有 base_urlmodel 不同:

from openai import OpenAI

client = OpenAI(
    base_url="https://buzzai.cc/v1",
    api_key="YOUR_BUZZ_KEY",
)

resp = client.chat.completions.create(
    model="claude-opus-4-8",
    messages=[{"role": "user", "content": "用两句话解释 B 树。"}],
)
print(resp.choices[0].message.content)

Claude Code —— 把它指向 BUZZ 一次,然后像选其他模型一样选 Opus 4.8:

export ANTHROPIC_BASE_URL=https://buzzai.cc
export ANTHROPIC_AUTH_TOKEN=YOUR_BUZZ_KEY
# 然后在 Claude Code 的模型选择器里选 claude-opus-4-8

价格

Opus 4.8 采用纯按量计费,无月费、无最低消费,和 BUZZ 上其他所有模型一致。

模型输入 / 百万输出 / 百万
Claude Opus 4.8$0.20$1.00
Claude Sonnet 4.6$0.12$0.60
Claude Haiku 4.5$0.04$0.20

prompt 缓存的读写按 Anthropic 官方折扣倍率自动计费。在拥有稳定、可复用前缀的工作负载上 —— 长系统提示、大型工具 schema、检索到的文档 —— 实际输入成本会远低于标价,因为大部分前缀是以缓存读取而非新输入的方式被处理的。如何组织请求才能真正命中缓存,见 prompt 缓存实战手册

从 4.7 升级:几乎什么都不用改

这次版本升级刻意做得很无聊。下面是你需要改动的全部内容:

关注点需要的改动
模型字符串claude-opus-4-7claude-opus-4-8
端点 / base URL
API 密钥
请求 / 响应结构
prompt 缓存标记(cache_control)
工具调用 / function calling 块
流式(SSE)处理

唯一需要留意的:缓存预热

prompt 缓存条目按模型隔离。你在 claude-opus-4-7 下缓存的前缀,不会带到 claude-opus-4-8 —— 新模型上的第一个请求是一次缓存未命中,会为该前缀支付完整的输入价格。这次预热之后,新模型上的缓存读取恢复正常。

实际影响:如果你在 4.7 和 4.8 之间做 A/B,两边各自维护缓存,所以要为两次预热而非一次做预算。要干净切换,直接把所有地方的模型字符串一次性改掉,接受一次预热周期即可。

如果你在会话中途切换模型,发现某一两个请求的 cache_read_input_tokens 掉到零,那是预期内的。随着新模型的缓存填充,它会回升。

什么时候用 Opus 4.8,什么时候用 Sonnet 4.6

Opus 是重量级:更深的推理、更擅长长链路多步 agentic 循环、在困难的代码和分析上更强。Sonnet 4.6 大约是输入价格的五分之一,是大多数聊天、起草和日常编码的合适默认值。一个常见的生产模式是把大部分流量路由到 Sonnet,只把困难请求升级到 Opus 4.8 —— 而因为 BUZZ 对两者使用同一把密钥、同一个端点,这个路由只是你自己代码里的一个字符串,而不是第二套集成。

Q1:Claude Opus 4.8 的模型标识符是什么?

claude-opus-4-8。连字符,不是小数点 —— claude-opus-4.8 会返回 404。把它作为 model 参数传给 https://buzzai.cc/v1(OpenAI 兼容)或 https://buzzai.cc(Anthropic Messages)。

Q2:从 4.7 升级需要改什么?

只需改 model 字符串。端点、密钥、请求结构、prompt 缓存标记、工具调用块全部不变。把 claude-opus-4-7 替换为 claude-opus-4-8 即可。

Q3:Opus 4.8 多少钱?

按量计费,无月费、无最低消费。输入每百万 token $0.20,输出每百万 token $1.00。prompt 缓存命中按 Anthropic 官方折扣倍率自动计费。

Q4:prompt 缓存对 Opus 4.8 生效吗?

生效,使用与当前 Claude 系列相同的 cache_control 标记。缓存按模型隔离,所以从 4.7 切换后预期会有一次预热。

Q5:可以用 OpenAI SDK 调用 Opus 4.8 吗?

可以。把 base_url 设为 "https://buzzai.cc/v1",api_key 设为你的 BUZZ 密钥,传 model="claude-opus-4-8"。同一个调用 gpt-5openai 客户端,改两个字符串即可调用 Opus 4.8。

现在就试用 Opus 4.8

注册、充值、复制密钥,一分钟内就能把第一个请求发给 claude-opus-4-8。只为你用掉的 token 付费。

创建账号
发布:2026-05-29
最近校订:2026-05-29