Claude Opus 4.8 在 BUZZ 上的模型标识符是什么?

标识符是 claude-opus-4-8。Anthropic 使用连字符而非小数点,所以 claude-opus-4.8 会返回 404。把 claude-opus-4-8 作为 model 参数传给 https://buzzai.cc/v1(OpenAI 兼容)或 https://buzzai.cc(Anthropic Messages),请求即路由到 Opus 4.8。

Claude Opus 4.8 在 BUZZ 上多少钱?

纯按量计费,无月费、无最低消费。Opus 4.8 输入为每百万 token $0.20,输出为每百万 token $1.00。prompt 缓存的读写按 Anthropic 官方折扣倍率自动计费,所以高缓存命中的工作负载只需支付输入价格的一小部分。

prompt 缓存对 Claude Opus 4.8 生效吗?

生效。Opus 4.8 支持与当前 Claude 系列相同的 cache_control 标记。缓存条目按模型隔离,所以在 claude-opus-4-7 下缓存的前缀,第一次发给 claude-opus-4-8 时是一次缓存未命中。切换后预期会有一次预热,之后缓存读取恢复正常。

可以用 OpenAI SDK 调用 Claude Opus 4.8 吗?

可以。把 base_url 设为 https://buzzai.cc/v1,api_key 设为你的 BUZZ 密钥,把 model=claude-opus-4-8 传给 client.chat.completions.create。BUZZ 会在 chat.completions 结构与 Anthropic Messages 结构之间双向转换,所以同一个调用 gpt-5 的 OpenAI 客户端,改两个字符串即可调用 Opus 4.8。

首页 · 博客 · Claude Opus 4.8 已上线

Claude Opus 4.8 已在 BUZZ 上线:模型名、价格与迁移指南

Q: 从 claude-opus-4-7 升级到 4.8 需要改什么?

只需改 model 字符串。端点、API 密钥、请求结构、prompt 缓存标记、工具调用块全部不变。把 claude-opus-4-7 替换为 claude-opus-4-8,升级即完成。

Claude Opus 4.8 现在可以通过 BUZZ AI Gateway 调用了。你不需要新账号、新端点或新密钥 —— 把模型字符串改成 claude-opus-4-8,你就用上了最新的 Opus。本文讲清楚精确的标识符、按量计费的价格、版本升级后 prompt 缓存的行为,以及切换时唯一需要留意的一点。

发布于 2026-05-29 · 阅读时间约 6 分钟

claude-opus-4-8模型标识符

$0.20输入 / 百万 token

$1.00输出 / 百万 token

0 改动端点与密钥

模型标识符

模型名是 claude-opus-4-8。和每一个 Claude 模型一样,Anthropic 使用连字符而非小数点 —— claude-opus-4.8 不是合法标识符,会返回 404 model not found。如果你切换后看到这个错误,先检查是不是多打了一个点。

BUZZ 在它已经提供的两个接口上都暴露了 Opus 4.8:

Anthropic Messages:https://buzzai.cc/v1/messages —— Claude Code 和官方 anthropic SDK 使用。
OpenAI 兼容:https://buzzai.cc/v1/chat/completions —— openai SDK 以及任何讲 chat.completions 结构的工具使用。

完整的实时模型列表始终发布在 https://buzzai.cc/models。只要名字出现在那里,你的密钥就能调用它。

如何调用

Anthropic Messages(curl):

curl https://buzzai.cc/v1/messages \
  -H "x-api-key: $BUZZ_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "content-type: application/json" \
  -d '{
    "model": "claude-opus-4-8",
    "max_tokens": 1024,
    "messages": [{"role": "user", "content": "用两句话解释 B 树。"}]
  }'

OpenAI SDK(Python)—— 相比标准 OpenAI 调用,只有 base_url 和 model 不同:

from openai import OpenAI

client = OpenAI(
    base_url="https://buzzai.cc/v1",
    api_key="YOUR_BUZZ_KEY",
)

resp = client.chat.completions.create(
    model="claude-opus-4-8",
    messages=[{"role": "user", "content": "用两句话解释 B 树。"}],
)
print(resp.choices[0].message.content)

Claude Code —— 把它指向 BUZZ 一次,然后像选其他模型一样选 Opus 4.8:

export ANTHROPIC_BASE_URL=https://buzzai.cc
export ANTHROPIC_AUTH_TOKEN=YOUR_BUZZ_KEY
# 然后在 Claude Code 的模型选择器里选 claude-opus-4-8

价格

Opus 4.8 采用纯按量计费,无月费、无最低消费,和 BUZZ 上其他所有模型一致。

模型	输入 / 百万	输出 / 百万
Claude Opus 4.8	$0.20	$1.00
Claude Sonnet 4.6	$0.12	$0.60
Claude Haiku 4.5	$0.04	$0.20

prompt 缓存的读写按 Anthropic 官方折扣倍率自动计费。在拥有稳定、可复用前缀的工作负载上 —— 长系统提示、大型工具 schema、检索到的文档 —— 实际输入成本会远低于标价,因为大部分前缀是以缓存读取而非新输入的方式被处理的。如何组织请求才能真正命中缓存,见 prompt 缓存实战手册。

从 4.7 升级:几乎什么都不用改

这次版本升级刻意做得很无聊。下面是你需要改动的全部内容:

关注点	需要的改动
模型字符串	`claude-opus-4-7` → `claude-opus-4-8`
端点 / base URL	无
API 密钥	无
请求 / 响应结构	无
prompt 缓存标记(`cache_control`)	无
工具调用 / function calling 块	无
流式(SSE)处理	无

唯一需要留意的:缓存预热

prompt 缓存条目按模型隔离。你在 claude-opus-4-7 下缓存的前缀,不会带到 claude-opus-4-8 —— 新模型上的第一个请求是一次缓存未命中,会为该前缀支付完整的输入价格。这次预热之后,新模型上的缓存读取恢复正常。

实际影响:如果你在 4.7 和 4.8 之间做 A/B,两边各自维护缓存,所以要为两次预热而非一次做预算。要干净切换,直接把所有地方的模型字符串一次性改掉,接受一次预热周期即可。

如果你在会话中途切换模型,发现某一两个请求的 cache_read_input_tokens 掉到零,那是预期内的。随着新模型的缓存填充,它会回升。

什么时候用 Opus 4.8,什么时候用 Sonnet 4.6

Opus 是重量级:更深的推理、更擅长长链路多步 agentic 循环、在困难的代码和分析上更强。Sonnet 4.6 大约是输入价格的五分之一,是大多数聊天、起草和日常编码的合适默认值。一个常见的生产模式是把大部分流量路由到 Sonnet,只把困难请求升级到 Opus 4.8 —— 而因为 BUZZ 对两者使用同一把密钥、同一个端点,这个路由只是你自己代码里的一个字符串,而不是第二套集成。

Q1:Claude Opus 4.8 的模型标识符是什么?

是 claude-opus-4-8。连字符,不是小数点 —— claude-opus-4.8 会返回 404。把它作为 model 参数传给 https://buzzai.cc/v1(OpenAI 兼容)或 https://buzzai.cc(Anthropic Messages)。

Q2:从 4.7 升级需要改什么?

只需改 model 字符串。端点、密钥、请求结构、prompt 缓存标记、工具调用块全部不变。把 claude-opus-4-7 替换为 claude-opus-4-8 即可。

Q3:Opus 4.8 多少钱?

按量计费,无月费、无最低消费。输入每百万 token $0.20,输出每百万 token $1.00。prompt 缓存命中按 Anthropic 官方折扣倍率自动计费。

Q4:prompt 缓存对 Opus 4.8 生效吗?

生效,使用与当前 Claude 系列相同的 cache_control 标记。缓存按模型隔离,所以从 4.7 切换后预期会有一次预热。

Q5:可以用 OpenAI SDK 调用 Opus 4.8 吗?

可以。把 base_url 设为 "https://buzzai.cc/v1",api_key 设为你的 BUZZ 密钥,传 model="claude-opus-4-8"。同一个调用 gpt-5 的 openai 客户端,改两个字符串即可调用 Opus 4.8。

现在就试用 Opus 4.8

创建账号

发布:2026-05-29
最近校订:2026-05-29