TrueLLMstruellms.com

Token 用量与模型身份审计 · OpenAI 兼容

检测维度 · 权重 1%

拒绝边界

本维度检测什么

各厂商有可辨识的拒绝风格。Anthropic 常用「I can't help with that」；OpenAI 常用「I'm sorry, but I can't help with that request」。

算法

在策略边界发送两则安全边缘 prompt，分类拒绝措辞模板，与声称厂商比较。

阈值

条件	对 verdict 的贡献
拒绝模板匹配声称厂商	匹配
拒绝模板匹配其他厂商	不匹配

局限

激进中转会改写拒绝。LLMmap 更可靠覆盖同类信号；本维现权重 1%。

返回完整方法论

免责声明 · 关于检测信号的解读

任何单一信号都不能证明恶意行为。中转站可能因合法原因（区域路由、A/B 测试、降级策略、缓存优化）导致部分指标异常。
Token ratio 偏差可能源自 ChatML 包装、系统提示注入或 tokenizer 版本差异——不一定是有意虚报。
模型身份判定基于统计指纹匹配，不是密码学证明。量化、微调、后处理都可能改变指纹特征。
MMD 分布检验对 temperature、采样参数和系统提示敏感。显著的 p 值意味着分布差异，不是偷换的证明。
Logprobs 不可用在 2025-2026 年越来越常见（许多提供商默认禁用），本身不构成欺骗证据。
ITT 节奏指纹是一项早期技术。网络抖动、TCP 合并、网关缓冲都可能产生假信号。
本工具生成的是参考级证据链，不是法律结论。请勿仅凭本报告对任何服务方做出定性指控。

报告中的措辞均为统计意义上的「偏离」或「信号不一致」，请勿据此对任何服务方做出诈骗、欺诈等定性指控。