工程博客
关于 AI 网关、Claude API、Prompt Caching、Tool Use、Streaming 的实战笔记。
-
Claude Opus 4.8 已在 BUZZ 上线:模型名、价格与迁移指南
claude-opus-4-8 现已可用,同一端点、同一密钥即可调用。精确模型标识符、按量计费价格、prompt 缓存预热行为,以及从 claude-opus-4-7 零改动升级。
-
Claude Code 切换 ANTHROPIC_BASE_URL 完整指南
env 变量 vs settings.json,ANTHROPIC_AUTH_TOKEN 与 ANTHROPIC_API_KEY 的关键区别,macOS / Linux / Windows 三平台配置 + 切换验证。
-
Claude API 错误码完全解读:401 / 403 / 429 / 500 / 529 的根因与排错命令
Anthropic API 错误码全集。401 的 5 种根因,429 的指数退避代码模板(Python / Node / Go),529 多上游 fallback 策略。
-
Prompt Cache 命中率从 30% 拉到 90%:cache_control 7 个反模式与修复
7 个让命中率悄悄归零的反模式,每个都有 ❌/✅ 代码对照。从 usage 字段诊断,实测从 30% 拉到 92%。
-
一行 base_url 把 OpenAI 项目接到 Claude:字段级兼容矩阵
22 字段兼容矩阵 × 4 列对照。完全兼容 / 部分兼容 / 静默丢弃,每个都有验证脚本。
-
BUZZ vs 传统 Claude 中转站:为什么 Claude Code 用户都在切换
9 维度对比 BUZZ 和传统 Claude 中转站。透明转发、Prompt Cache、Tool Use、Streaming 全保真。开发者深度选型指南。
-
AI 网关选型:BUZZ vs OpenRouter vs Helicone vs LiteLLM
实战对比 4 个 AI 网关产品。成本、数据留存策略、多模型覆盖度、运维体验,逐项打分。
-
Anthropic Prompt Caching 生产实践:成本优化全攻略
cache_control 机制、命中率诊断、踩坑记录。把长会话成本砍掉 90% 的实战手册。
-
Claude API 经过网关:工程实战指南
Anthropic Claude API 经过透明零留存网关。Streaming、Tool Use、Prompt Cache、价格说明,带 Python 代码。
-
Claude Code 通过网关降本不掉能力
Claude Code 强大但贵。通过网关接入,既保留全部能力又显著降低账单。
-
Claude Tool Use 经过网关:Streaming、错误、成本模式
Claude tool use 经过透明网关的实战。Streaming、错误处理、多轮 function calling 的成本模型。
-
一个 API Key 调 Claude / GPT / Gemini / Grok
代码示例为主:在一个 OpenAI 兼容 key 后面同时跑 Claude、GPT、Gemini 和 Grok。
-
OpenAI SDK 调 Claude(Gemini / Grok)兼容指南
用官方 OpenAI SDK 调 Claude / Gemini / Grok 的实战指南。透明转发的即插即用兼容路径。
-
零数据留存 LLM 网关:为什么企业需要不记录请求的转发器
企业团队的零数据留存 LLM 网关实战。隐私策略、上游配置、审计员真正关注的点。