2026年5月30日 · TrueLLMs
脱敏实测:一次中转站 token 计费注水审查
一次脱敏的 /vet 差分模式审计:某第三方中转站是真 Claude tokenizer、能力无退化,但每请求固定多报约 +24 个 input tokens。
这是一个脱敏后的 /vet 差分模式实测案例。被测对象是某第三方中转站,通过 OpenAI 兼容接口对外提供 claude-opus-4-8,上游转发官方 Anthropic API。参照侧使用官方 Anthropic key 直连同一声称模型。
结论不是模型偷换。切词器与能力证据都与官方参照一致。问题出在计费:该中转站在每个请求上固定多报 input tokens,对短聊天请求影响很大。
第一轮先暴露了传输层 bug
第一次审计 41/41 请求全失败,没有拿到可用测量。原因不是模型输出,而是请求带 temperature: 0 时,该中转站返回 HTTP 400;其上游官方 Anthropic opus-4-x 在这条路径下拒绝显式的零 temperature。
- 失败形态:所有探针都在进入切词器、能力、计费证据前失败。
- 修法:只有 temperature > 0 时才发送 temperature 字段,两种 API 格式保持一致。
- 经验:OpenAI 兼容但上游是 Anthropic 的中转站很常见,网关小怪癖可能让审计静默变成无数据。
重跑后的证据
修复 temperature 处理后,同一差分审计在切词器、能力与 usage 计费三个方向都拿到了可用证据。
1. 切词器差分:逐探针斜率一致
Claude 切词器闭源,无法在本地做绝对正向确认。这里差分模式是关键:同一组切词器探针对被测中转与官方 Anthropic 参照同时运行,然后比较 prompt_tokens 斜率。
结果逐探针一致:cjk 约 31,emoji 约 52,mixed-rare 约 52,ascii-ctrl 约 28,被测等于参照。这说明用的是真 Claude 切词器,而不是 OpenAI 家族切词器或临时计数器。
2. 能力差分:无退化
能力地板也与官方参照一致。通过率与参照运行一致,在本次抽样的能力题上没有观察到降级。
3. 计费差分:每请求固定 +24 input tokens
usage 计费显示每个请求都有相同的额外 input tokens。短句:10 -> 34。中文短 prompt:22 -> 46。英文长 prompt:63 -> 87。代码 prompt:44 -> 68。delta 恒为 +24。
由于切词器斜率与官方参照一致,这不是切词差异导致的。该模式疑似每请求注入约 24 token 的隐藏 system prompt 并向用户计费;审计无法证明隐藏文本的具体内容。
注:上面的 +24 token / +240% 是 token 数量,不是花费;实际成本 = token 数 × 单价。中转站常以低于官方单价出售(例如 0.6×),所以 token 虚报未必比官方贵。固定注入对短请求影响大,可能反而更贵;对长上下文影响小。是否构成成本掺水,取决于该端点单价与你的 prompt 长度。
风险应该如何报告
- 计费问题应报告为约 +24 input tokens/请求。
- 对短聊天类请求,观察到的超收可达 +240%。
- 对本次样本中的长上下文请求,影响约 +38%。
- 单一聚合百分比,本次约 +58.7%,信息量较低,因为它取决于 prompt 组合。
诚实边界
- 差分一致不等于供应商认证。它只说明本次样本在被测信号上与官方参照一致。
- 对抗性路由仍可能只对测试流量表现正常,而对其它流量走不同路径。
- 本次结论是抽样结论:该运行支持真 claude-opus-4-8、未观察到能力退化、观察到固定计费偏移。
- 固定偏移应视为计费风险,不等于证明隐藏注入的具体文本或业务意图。
- 如果只用绝对模式,本案无法锁定 Claude 切词器身份,因为切词器闭源。
- 差分模式是关键方法:先有可信官方参照,再比较斜率、通过率与 usage 字段。
运行一次差分审计 用官方参照审你自己的中转端点,才能拿到这种级别的证据。