登录

参与者


分类

频率

在四种大语言模型中,GPT-4.5有73%被判定为人类,这意味着“裁判”选择它为“人类”的频率显著高于选择真实人类参与者的频率。
文章