全部维度

维度 · 计分权重 0%

自我识别探测

本维度检测什么

问模型“你是谁”仍保留展示,因为用户会期待看到,但它明确只是诊断。system prompt 或代理改写几乎可以强制任意答案。

算法

发送直接身份问题,扫描响应是否包含声称模型或冲突模型家族。原文作为轶事证据保存。

阈值

条件对 verdict 的贡献
提到声称模型诊断匹配
提到其他模型诊断异常
未提到模型诊断证据不足

局限

该信号极易伪造,绝不能作为身份或偷换证明。

返回完整方法论