工程博客

来自网关的笔记

关于多厂商 LLM 路由、prompt 缓存、计费内幕,以及用一把密钥运行 Claude、GPT、Gemini 的实战写作。

当计费溢出:一个整数如何把扣费变成充值

一类反复出现的 LLM 计费 bug:图片数量、视频时长、max_tokens 等用户可控参数溢出 int64,把扣费翻转成充值。原理、如何自查,以及封堵它的两道防线。

2026 年 7 月 8 日阅读分析 →

全部文章

公告2026-06-30

Claude Sonnet 5 已在 BUZZ 上线:模型名、价格与迁移指南

claude-sonnet-5 是 Claude 5 家族的均衡主力——比 Sonnet 4.6 又新又便宜。模型标识符、价格,以及零改动升级路径。

模型选型2026-06-30

Claude 5 家族选型:Fable 5、Sonnet 5 与 Haiku 怎么选

一把密钥路由整个 Claude 5 家族的决策树。按请求难度匹配模型、默认加升级策略,以及让它值回票价的成本测算。

趋势解读2026-06-09

高于 Opus:「Mythos 级」透露了模型走向的什么信号

Claude 5 引入了高于 Opus 的 Mythos 级。新的顶层意味着什么——前沿模型与默认模型的差距在拉大,以及为什么该按请求难度路由,而不是无脑用最新最强的那个。

公告2026-06-09

Claude Fable 5 已在 BUZZ 上线:模型名、价格与迁移指南

claude-fable-5 是 Anthropic Claude 5 家族首个模型,也是其能力最强的通用可用模型,现已可用,同一端点、同一密钥即可调用。模型标识符、按量计费价格,以及从 Opus 4.8 零改动切换。

公告2026-05-29

Claude Opus 4.8 已在 BUZZ 上线:模型名、价格与迁移指南

claude-opus-4-8 现已可用,同一端点、同一密钥即可调用。精确模型标识符、按量计费价格、prompt 缓存预热行为,以及从 claude-opus-4-7 零改动升级。

配置2026-05-26

Claude Code 切换 ANTHROPIC_BASE_URL 完整指南

env 变量 vs settings.json,ANTHROPIC_AUTH_TOKEN 与 ANTHROPIC_API_KEY 的关键区别,macOS / Linux / Windows 三平台配置 + 切换验证。

错误码2026-05-26

Claude API 错误码完全解读:401 / 403 / 429 / 500 / 529 的根因与排错命令

Anthropic API 错误码全集。401 的 5 种根因,429 的指数退避代码模板(Python / Node / Go),529 多上游 fallback 策略。

优化2026-05-26

Prompt Cache 命中率从 30% 拉到 90%:cache_control 7 个反模式与修复

7 个让命中率悄悄归零的反模式,每个都有 ❌/✅ 代码对照。从 usage 字段诊断,实测从 30% 拉到 92%。

迁移2026-05-26

一行 base_url 把 OpenAI 项目接到 Claude:字段级兼容矩阵

22 字段兼容矩阵 × 4 列对照。完全兼容 / 部分兼容 / 静默丢弃,每个都有验证脚本。

选型对比2026-05-26

BUZZ vs 传统 Claude 中转站:为什么 Claude Code 用户都在切换

9 维度对比 BUZZ 和传统 Claude 中转站。透明转发、Prompt Cache、Tool Use、Streaming 全保真。开发者深度选型指南。

架构2026-05-22

AI 网关选型:BUZZ vs OpenRouter vs Helicone vs LiteLLM

实战对比 4 个 AI 网关产品。成本、数据留存策略、多模型覆盖度、运维体验,逐项打分。

成本优化2026-05-22

Anthropic Prompt Caching 生产实践:成本优化全攻略

cache_control 机制、命中率诊断、踩坑记录。把长会话成本砍掉 90% 的实战手册。

工程2026-05-22

Claude API 经过网关:工程实战指南

Anthropic Claude API 经过透明零留存网关。Streaming、Tool Use、Prompt Cache、价格说明,带 Python 代码。

成本优化2026-05-22

Claude Code 通过网关降本不掉能力

Claude Code 强大但贵。通过网关接入,既保留全部能力又显著降低账单。

工程2026-05-22

Claude Tool Use 经过网关:Streaming、错误、成本模式

Claude tool use 经过透明网关的实战。Streaming、错误处理、多轮 function calling 的成本模型。

多模型2026-05-22

一个 API Key 调 Claude / GPT / Gemini / Grok

代码示例为主:在一个 OpenAI 兼容 key 后面同时跑 Claude、GPT、Gemini 和 Grok。

兼容性2026-05-22

OpenAI SDK 调 Claude(Gemini / Grok)兼容指南

用官方 OpenAI SDK 调 Claude / Gemini / Grok 的实战指南。透明转发的即插即用兼容路径。

合规2026-05-22

零数据留存 LLM 网关:为什么企业需要不记录请求的转发器

企业团队的零数据留存 LLM 网关实战。隐私策略、上游配置、审计员真正关注的点。