登录

参与者

分类

频率

在四种大语言模型中，GPT-4.5有73%被判定为人类，这意味着“裁判”选择它为“人类”的频率显著高于选择真实人类参与者的频率。

文章