首页 · 博客 · OpenAI 到 Claude 字段兼容矩阵

一行 base_url 把 OpenAI 项目接到 Claude:字段级兼容矩阵 + 不兼容字段清单

Q: 用 OpenAI SDK 调 Claude,真的只改 base_url 就够吗?

对于 90% 的 chat.completions 用法是够的:base_url 指向兼容网关 + model 改成 claude-* 即可。但如果你用了 n、logprobs、frequency_penalty、response_format=json_schema 这类 Claude 不支持的字段,需要在迁移前移除或改写。本文有完整字段矩阵。

Q: stream=true 在 OpenAI 兼容路径下能正常工作吗?

可以。BUZZ 把 Anthropic 的 SSE 事件(message_start / content_block_delta / message_stop)实时转成 OpenAI 的 chunk 格式,逐 token 推送。chunk 的 choices[0].delta.content 字段和你直接用 OpenAI 时一致。

Q: function calling / tools 字段需要改写吗?

OpenAI 的 tools 数组(包含 type: function 和 function.parameters JSON Schema)由网关自动转成 Anthropic 的 tools 数组(input_schema)。tool_calls 和 tool_call_id 也会被映射成 tool_use / tool_result。你的代码不用改。

Q: 为什么我设置的 n=3 / logprobs 没生效?

Claude API 不支持 n(一次返回多个 completion)和 logprobs(返回 token 概率)。OpenAI 兼容路径会忽略这些字段,只返回一个 completion。如果业务依赖 n,需要在客户端循环调用;依赖 logprobs 的场景目前没有等价替代。

Q: response_format=json_object 能用吗?

OpenAI 兼容路径支持 response_format=json_object,网关会在 system 末尾追加 JSON 输出指令并解析返回。但 response_format=json_schema(strict mode)目前不支持,因为 Claude 没有等价的 strict JSON schema 约束机制。建议改用 tool_use 强制结构化输出。

Q: 迁移后温度 / top_p 的行为一致吗?

字段名一致,但模型本身的采样曲线不同。OpenAI temperature=0.7 和 Claude temperature=0.7 不会输出完全一样风格的内容。生产环境建议在迁移后重新调参,做 A/B 评测,而不是直接套用 OpenAI 的最优参数。

Q: OpenAI 的 max_tokens 默认无穷,Claude 必须显式传,这怎么处理?

Anthropic /v1/messages 要求 max_tokens 必传。BUZZ 兼容层会在你没传 max_tokens 时自动补一个默认值(通常 4096),保证请求不会因为缺字段失败。但建议显式传,避免长文本被意外截断。

已经写好的 OpenAI 项目想加 Claude,改一行 base_url 就够吗?对于绝大多数 chat.completions 调用,答案是"够"。但有 5 个字段会被静默忽略,3 个字段行为不一致,2 个字段必须改写 —— 这些不查清楚,迁移上线那天会踩到原本可避免的坑。本文给完整 17 字段兼容矩阵 + Python / Node / LangChain 迁移代码 + 5 个真实踩坑记录。

2026-05-26 · 阅读约 12 分钟 · 适合从 OpenAI 迁移到 Claude 的存量项目

17字段对照

9完全兼容

3部分兼容

5不兼容/忽略

为什么不直接用 Anthropic SDK

"既然要用 Claude,直接换成 Anthropic SDK 不就完了"—— 这句话在新项目里成立,但存量项目根本不是这么回事。

典型场景:

已经在跑的 RAG / Agent 项目:几十处 client.chat.completions.create(...) 散落各处,改造成本是几天到几周。
用了 LangChain / LlamaIndex 等上层框架:框架以 OpenAI 接口为内部规范,改 SDK 等于改框架。
多模型切换需求:产品里要同时跑 GPT、Claude、自部署模型,统一用 OpenAI 接口最省事。
团队习惯:工程师肌肉记忆是 chat.completions,临时切换 messages API 需要查文档。
测试覆盖:旧测试 mock 的是 OpenAI 响应结构,改 SDK 等于全部测试要重写。

"一行 base_url 接到兼容网关"是迁移成本最低的路径。等业务跑稳了,再决定要不要切到 Anthropic 原生 SDK 解锁 cache_control、tool_use 高级 schema 这些原生 feature。

另一个常被低估的原因:多模型 fallback。生产环境里你可能希望"GPT 限流时切 Claude,Claude 限流时切自部署模型"。这种 failover 逻辑写在统一接口下,代码简洁很多。OpenAI 兼容路径让一套代码能跑多家上游,迁移到 Claude 只是把"加一家"做了一次。

OpenAI 兼容路径的工作原理

BUZZ(以及任何提供 OpenAI 兼容路径的网关)在 /v1/chat/completions 后面做的事是:

客户端                    网关                    Anthropic
   |                       |                         |
   | POST /v1/chat/completions                       |
   | (OpenAI schema)       |                         |
   |---------------------->|                         |
   |                       | 1. 解析 OpenAI 请求      |
   |                       | 2. 字段映射到 messages   |
   |                       |    - messages 重组       |
   |                       |    - tools 转换          |
   |                       |    - 不支持字段丢弃       |
   |                       | 3. POST /v1/messages    |
   |                       |------------------------->|
   |                       |                         |
   |                       | 4. 收到 Anthropic 响应    |
   |                       |<-------------------------|
   |                       | 5. 反向映射到 OpenAI 格式 |
   |                       |    - choices[0].message |
   |                       |    - tool_calls         |
   |                       |    - usage 字段重命名    |
   | 6. 返回 OpenAI 响应    |                         |
   |<----------------------|                         |

关键点是无状态字段映射:网关不缓存任何会话信息,每个请求独立翻译。这意味着延迟开销很小(通常 1-3ms),也意味着兼容性受限于"两边 schema 都能表达的最大公约数"。

下面这张矩阵就是这个最大公约数的精确边界。

完整字段兼容矩阵

所有 OpenAI chat.completions 字段对照 Claude API 的兼容性。这张表是迁移决策的核心依据。

OpenAI 字段	Claude 等价	兼容性	备注
`model`	`model`	完全	值改成 `claude-opus-4-8` / `claude-sonnet-4-6` / `claude-haiku-4-5`
`messages`	`messages` + `system`	部分	`role: system` 抽出到顶级 `system` 字段
`max_tokens`	`max_tokens`	部分	OpenAI 可省略,Claude 必传(网关会补默认 4096)
`max_completion_tokens`	`max_tokens`	完全	OpenAI 新字段,网关会自动映射
`temperature`	`temperature`	部分	字段名同,采样曲线不同。建议重新调参
`top_p`	`top_p`	完全	语义一致
`top_k`	`top_k`	完全	OpenAI 新版才支持,Claude 一直支持
`stop`	`stop_sequences`	完全	网关自动重命名,字符串数组语义一致
`stream`	`stream`	完全	SSE chunk 实时转译,delta 字段保真
`stream_options`	(无)	部分	`include_usage` 网关自动模拟,其余忽略
`tools`	`tools`	完全	JSON Schema 自动映射到 `input_schema`
`tool_choice`	`tool_choice`	完全	`auto` / `required` / `{type:function,...}` 全支持
`response_format`	(部分)	部分	`json_object` 通过 system 注入实现;`json_schema` 不支持
`seed`	(无)	忽略	Claude 没有可重复采样的 seed,网关静默丢弃
`n`	(无)	忽略	Claude 不支持单请求多 completion,只返回 1 条
`presence_penalty`	(无)	忽略	Claude 没有等价采样修正,直接丢弃
`frequency_penalty`	(无)	忽略	同上
`logprobs`	(无)	忽略	Claude 不返回 token 概率分布
`top_logprobs`	(无)	忽略	同上
`logit_bias`	(无)	忽略	Claude 不支持 token 级偏置
`user`	`metadata.user_id`	完全	用户标识透传到 Anthropic abuse detection
`parallel_tool_calls`	(默认行为)	部分	Claude 默认允许并行 tool_use,无开关字段

完全兼容的字段

这 9 个字段在 OpenAI 兼容路径下行为和 OpenAI 原生完全一致。可以放心保留:

model
top_p
top_k
stop / stop_sequences(自动重命名)
stream
tools
tool_choice
user
max_completion_tokens

验证脚本

import os
from openai import OpenAI

client = OpenAI(
    base_url="https://buzzai.cc/v1",
    api_key=os.environ["BUZZ_API_KEY"],
)

# 同一段 prompt 测试 5 个完全兼容字段
resp = client.chat.completions.create(
    model="claude-sonnet-4-6",
    messages=[{"role": "user", "content": "数 1 到 5"}],
    max_tokens=128,
    temperature=0.7,
    top_p=0.9,
    stop=["6"],
    user="test_user_001",
)

print(resp.choices[0].message.content)
print("usage:", resp.usage)
# 输出应该停在 "5" 之前
# usage 字段名: prompt_tokens / completion_tokens / total_tokens(网关从 Anthropic 的 input_tokens / output_tokens 翻译)

部分兼容字段(行为有差异)

这些字段网关会处理,但行为和 OpenAI 原生不完全一致,迁移时要意识到差异。

messages:system 角色的位置

OpenAI 把 system 当作 messages 数组的一员,Claude 把 system 抽到顶级字段。网关会自动重组:

// 你发的 OpenAI 格式
{
  "messages": [
    {"role": "system", "content": "你是助手"},
    {"role": "user", "content": "你好"}
  ]
}

// 网关转成 Anthropic 格式
{
  "system": "你是助手",
  "messages": [
    {"role": "user", "content": "你好"}
  ]
}

如果你在 messages 中间塞了多个 system(OpenAI 允许),网关会拼接成一个 system 字符串。

stop vs stop_sequences:数量上限

OpenAI 允许最多 4 个 stop 序列,Claude 也是 4 个。一致。但 OpenAI 接受单字符串(如 stop: "###"),Claude 严格要求数组。网关会做容错转换。

stream:chunk 格式差异

OpenAI 流式 chunk:

data: {"id":"chatcmpl-xxx","object":"chat.completion.chunk","created":1716700000,"model":"claude-sonnet-4-6","choices":[{"index":0,"delta":{"content":"你"},"finish_reason":null}]}

data: {"id":"chatcmpl-xxx","object":"chat.completion.chunk","created":1716700000,"model":"claude-sonnet-4-6","choices":[{"index":0,"delta":{"content":"好"},"finish_reason":null}]}

data: [DONE]

Anthropic 流式事件:

event: message_start
data: {"type":"message_start","message":{"id":"msg_xxx","model":"claude-sonnet-4-6",...}}

event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"text_delta","text":"你"}}

event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"text_delta","text":"好"}}

event: message_stop
data: {"type":"message_stop"}

网关把后者实时翻译成前者。客户端用 OpenAI SDK 解析时,完全感觉不到底层是 Claude。

response_format:json_object 支持,json_schema 不支持

# 这个网关支持
client.chat.completions.create(
    model="claude-sonnet-4-6",
    messages=[{"role": "user", "content": "返回 JSON: name, age"}],
    response_format={"type": "json_object"},
    max_tokens=256,
)
# 网关在 system 末尾追加 "Always respond with valid JSON" 实现

# 这个网关不支持(strict schema)
client.chat.completions.create(
    response_format={
        "type": "json_schema",
        "json_schema": {"name": "Person", "schema": {...}, "strict": True}
    },
)
# 报错:json_schema strict mode not supported, use tool_use instead

需要严格 schema 输出时,改用 tools + tool_choice: required。

不兼容字段(直接被忽略)

下面这些字段你可以发,但网关会静默丢弃。不会报错,也不会生效。这是迁移时最容易踩的坑。

字段	OpenAI 行为	Claude 兼容路径行为
`n: 3`	返回 3 个 completion	只返回 1 个
`logprobs: true`	返回 token 概率	响应里没有 logprobs 字段
`top_logprobs: 5`	返回 top 5 候选	同上
`frequency_penalty: 0.5`	抑制重复 token	无效果
`presence_penalty: 0.5`	鼓励新主题	无效果
`logit_bias: {...}`	token 级偏置	无效果
`seed: 42`	采样可复现	无效果(每次结果可能不同)

检测脚本:扫描你的项目里有没有这些字段

#!/usr/bin/env bash
# 在项目根目录跑,列出所有用到不兼容字段的位置

INCOMPATIBLE_FIELDS=(
  "frequency_penalty"
  "presence_penalty"
  "logit_bias"
  "logprobs"
  "top_logprobs"
  '"n":'
  '"seed":'
)

for field in "${INCOMPATIBLE_FIELDS[@]}"; do
  echo "=== $field ==="
  grep -rn "$field" --include="*.py" --include="*.ts" --include="*.js" .
done

跑出来如果有结果,迁移前要么删掉这些字段,要么对依赖 OpenAI 的逻辑做降级处理。常见降级策略:n=3 改成在客户端起 3 个并发请求(注意会有 3 倍 token 成本);frequency_penalty / presence_penalty 改成在 system prompt 里加一句"避免重复用词、保持话题多样";logprobs 依赖的判定逻辑,迁到用 LLM 自己输出"置信度"这种近似方案。

Function calling / tools 字段映射

这是迁移里最容易出问题的部分,但其实兼容层做得相当完整。

OpenAI tools 定义

tools = [
    {
        "type": "function",
        "function": {
            "name": "get_weather",
            "description": "获取指定城市的天气",
            "parameters": {
                "type": "object",
                "properties": {
                    "city": {"type": "string", "description": "城市名"},
                    "unit": {"type": "string", "enum": ["celsius", "fahrenheit"]}
                },
                "required": ["city"]
            }
        }
    }
]

网关自动转成 Anthropic tools

{
  "tools": [
    {
      "name": "get_weather",
      "description": "获取指定城市的天气",
      "input_schema": {
        "type": "object",
        "properties": {
          "city": {"type": "string", "description": "城市名"},
          "unit": {"type": "string", "enum": ["celsius", "fahrenheit"]}
        },
        "required": ["city"]
      }
    }
  ]
}

响应里的 tool_calls 也会从 Anthropic 的 tool_use content block 反向映射:

# 你看到的 OpenAI 格式响应
{
  "choices": [{
    "message": {
      "role": "assistant",
      "content": null,
      "tool_calls": [{
        "id": "call_abc123",
        "type": "function",
        "function": {
          "name": "get_weather",
          "arguments": "{\"city\":\"Tokyo\",\"unit\":\"celsius\"}"
        }
      }]
    },
    "finish_reason": "tool_calls"
  }]
}

# Anthropic 原生格式(网关内部)
{
  "stop_reason": "tool_use",
  "content": [{
    "type": "tool_use",
    "id": "toolu_01ABC",
    "name": "get_weather",
    "input": {"city": "Tokyo", "unit": "celsius"}
  }]
}

下一轮调用,你按 OpenAI 的写法塞 role: tool + tool_call_id 就行,网关会再转成 tool_result。

限制

嵌套对象 schema:OpenAI 接受 $ref 引用,Claude 也支持但行为偶有不一致。建议把 schema 展平。
strict mode:OpenAI 的 strict: true 在网关侧会被忽略,Claude 默认就是较严格的 schema 校验。
parallel_tool_calls: false:Claude 没有禁用并行的开关,只能在 prompt 里要求"一次只调用一个工具"。

代码迁移示例:Python / Node / LangChain

Python(openai SDK)

# Before(直连 OpenAI)
from openai import OpenAI

client = OpenAI(api_key=os.environ["OPENAI_API_KEY"])

resp = client.chat.completions.create(
    model="gpt-4o",
    messages=[{"role": "user", "content": "Hello"}],
    max_tokens=512,
    temperature=0.7,
    frequency_penalty=0.3,   # 删掉,Claude 不支持
)


# After(BUZZ 兼容路径)
from openai import OpenAI

client = OpenAI(
    base_url="https://buzzai.cc/v1",
    api_key=os.environ["BUZZ_API_KEY"],
)

resp = client.chat.completions.create(
    model="claude-sonnet-4-6",   # 改 model
    messages=[{"role": "user", "content": "Hello"}],
    max_tokens=512,               # 显式传(Claude 必填)
    temperature=0.7,
    # frequency_penalty 已删除
)

Node.js(openai SDK v4)

// Before
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.OPENAI_API_KEY,
});

const resp = await client.chat.completions.create({
  model: "gpt-4o",
  messages: [{ role: "user", content: "Hello" }],
  max_tokens: 512,
  n: 1,                  // 保留也无所谓,但显式 1 没意义
  presence_penalty: 0.2, // 删掉
});


// After
import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://buzzai.cc/v1",
  apiKey: process.env.BUZZ_API_KEY,
});

const resp = await client.chat.completions.create({
  model: "claude-opus-4-8",
  messages: [{ role: "user", content: "Hello" }],
  max_tokens: 512,
});

LangChain(langchain-openai)

# Before
from langchain_openai import ChatOpenAI

llm = ChatOpenAI(
    model="gpt-4o",
    api_key=os.environ["OPENAI_API_KEY"],
    temperature=0.7,
)


# After:不换 ChatOpenAI 类,只改 base_url + model
from langchain_openai import ChatOpenAI

llm = ChatOpenAI(
    model="claude-sonnet-4-6",
    api_key=os.environ["BUZZ_API_KEY"],
    base_url="https://buzzai.cc/v1",
    temperature=0.7,
    max_tokens=4096,   # 建议显式传
)

# 后续 chain.invoke / chain.stream 调用全部不用改

cURL(快速验证)

curl https://buzzai.cc/v1/chat/completions \
  -H "Authorization: Bearer $BUZZ_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "claude-sonnet-4-6",
    "messages": [{"role": "user", "content": "Hello"}],
    "max_tokens": 256
  }'

踩坑记录(5 个真实迁移问题)

坑 1:max_tokens 没传,响应被截断

现象:OpenAI 项目习惯不传 max_tokens,Claude 必填。网关补默认值后,长输出被截到 4096 token。

修复:在所有 chat.completions 调用显式传 max_tokens,根据业务设到合理值(代码生成场景建议 8000+,对话场景 2000 够用)。

坑 2:JSON 输出场景被换行包了一层 ```

现象:迁移前 GPT 直接返回 {"name":"Tom"},迁移后 Claude 返回 ```json\n{"name":"Tom"}\n```,业务代码 JSON.parse 报错。

修复:要么用 response_format: {type: "json_object"}(网关会注入指令避免 markdown 包裹),要么客户端解析前先剥 markdown fence。最稳的做法是用 tools + tool_choice: required 强制结构化。

坑 3:多个 system message 被合并,顺序错了

现象:OpenAI 项目在 messages 中间塞了 3 个 system(任务说明 / 风格指引 / 安全规则),Claude 的 system 是字符串,只能拼接。

修复:迁移前在客户端先把多个 system 合并成一条;或者用 OpenAI 的"developer + user"分层结构。BUZZ 兼容层会按数组顺序拼接,但建议显式合并以保证可读性。

坑 4:tool_call_id 在长会话里偶尔不匹配

现象:多轮 tool calling 长会话,某一轮提示 tool_use_id not found in messages。

原因:OpenAI 允许 role: tool 消息和 assistant 消息顺序略有偏差,Claude 严格要求 tool_use 紧跟 tool_result,不允许中间插用户消息。

修复:确保你的消息历史维护逻辑是 assistant(tool_use) → tool(tool_result) → assistant → user 这个严格顺序。如果中间插了 user,Claude 会拒绝。

坑 5:温度调到 0 还是有不同结果

现象:OpenAI temperature=0 几乎可重复,Claude 同样设置每次输出仍有微差。

原因:Claude 的"温度 0"不是完全确定性采样,而是低温度近似贪心。加上没有 seed 字段,完全可重复目前做不到。

修复:对可重复性敏感的场景(如自动化测试快照),迁移到 Claude 后需要用 LLM-as-judge 做语义比较,而不是字符串比较。或者把 prompt 工程得足够具体,把模型创造性空间压到最小。

额外提醒:计费字段名差异

OpenAI 响应里的 usage 字段是 prompt_tokens / completion_tokens / total_tokens,Anthropic 是 input_tokens / output_tokens / cache_creation_input_tokens / cache_read_input_tokens。BUZZ 兼容路径会把后者翻译成前者,以便客户端代码不用改。但要拿到 cache 命中详情,得切到 Anthropic 原生路径才看得到完整字段。

什么时候应该最终切到 Anthropic 原生 SDK

OpenAI 兼容路径解决的是"快速接通",但有些 Claude 高级 feature 在 OpenAI schema 里没法表达,需要切到 @anthropic-ai/sdk 才能用:

Prompt Cache(cache_control: ephemeral):长 system prompt 命中缓存可以省 90% 输入费用。OpenAI 兼容路径目前不暴露这个字段。
Vision 高级控制:image 字段的 media_type 自定义、base64 / url 双格式。
Extended thinking:Claude 4.7 的可控思考预算字段。
Tool 高级 schema:cache_control 加在 tool definition 上,长 tool list 能命中缓存。
批处理 API:/v1/messages/batches 异步批量,50% 折扣。OpenAI 也有 batches,但接口结构不同。

建议路径:第一阶段用 OpenAI 兼容路径快速接通业务;第二阶段对热点路径(高频长会话、长 system prompt)切到 Anthropic 原生 SDK 解锁 Prompt Cache。

FAQ

Q1: 用 OpenAI SDK 调 Claude,真的只改 base_url 就够吗?

对于 90% 的 chat.completions 用法是够的:base_url 指向兼容网关 + model 改成 claude-* 即可。但如果你用了 n、logprobs、frequency_penalty、response_format=json_schema 这类 Claude 不支持的字段,需要在迁移前移除或改写。本文有完整字段矩阵。

Q2: OpenAI 兼容路径和 Anthropic 原生 SDK 性能上有差别吗?

BUZZ 的 OpenAI 兼容层在网关侧做无状态字段映射,额外延迟通常在 1-3ms。token 计费和原生 messages 接口完全一致。如果你打算长期用 Claude,建议最终切到 Anthropic SDK,可以解锁 cache_control、tool_use 高级 schema 等原生字段。

Q3: stream=true 在 OpenAI 兼容路径下能正常工作吗?

可以。BUZZ 把 Anthropic 的 SSE 事件(message_start / content_block_delta / message_stop)实时转成 OpenAI 的 chunk 格式,逐 token 推送。chunk 的 choices[0].delta.content 字段和你直接用 OpenAI 时一致。

Q4: function calling / tools 字段需要改写吗?

OpenAI 的 tools 数组(包含 type: function 和 function.parameters JSON Schema)由网关自动转成 Anthropic 的 tools 数组(input_schema)。tool_calls 和 tool_call_id 也会被映射成 tool_use / tool_result。你的代码不用改。

Q5: 为什么我设置的 n=3 / logprobs 没生效?

Claude API 不支持 n(一次返回多个 completion)和 logprobs(返回 token 概率)。OpenAI 兼容路径会忽略这些字段,只返回一个 completion。如果业务依赖 n,需要在客户端循环调用;依赖 logprobs 的场景目前没有等价替代。

Q6: response_format=json_object 能用吗?

OpenAI 兼容路径支持 response_format=json_object,网关会在 system 末尾追加 JSON 输出指令并解析返回。但 response_format=json_schema(strict mode)目前不支持,因为 Claude 没有等价的 strict JSON schema 约束机制。建议改用 tool_use 强制结构化输出。

Q7: 迁移后温度 / top_p 的行为一致吗?

字段名一致,但模型本身的采样曲线不同。OpenAI temperature=0.7 和 Claude temperature=0.7 不会输出完全一样风格的内容。生产环境建议在迁移后重新调参,做 A/B 评测,而不是直接套用 OpenAI 的最优参数。

Q8: OpenAI 的 max_tokens 默认无穷,Claude 必须显式传,这怎么处理?

Anthropic /v1/messages 要求 max_tokens 必传。BUZZ 兼容层会在你没传 max_tokens 时自动补一个默认值(通常 4096),保证请求不会因为缺字段失败。但建议显式传,避免长文本被意外截断。

开始用 OpenAI SDK 调 Claude

立即注册

本文最初发表于 2026-05-26,作者 BUZZ AI Gateway 团队。

如果文章有事实错误或代码示例不工作,请通过工单系统反馈。