人类应警惕AI的讨好型回复

新研究发现,AI应用普遍存在过度讨好用户的行为,这反而会损害用户的判断力。
林曦
责任编辑:王江涛
如果我们向 AI 寻求人际方面的建议,它们很可能会说我们想听的话,但 不会告诉我们需要听 的话。 这种 无底线 刻意 讨好 用户的 行为 , 自 A I 聊天 机器人 广泛 应用 以来 ,就 受到 人们的特别关注 。
最近 , 斯坦福大学计算机科学 系 的 研究 人员 , 系统 分析 了 市面 上 1 1 个 主要的 A I 应用 后 发现 , 这种 讨好 、 迎合 用户 的 行为 不仅 普遍 存在 , 而且 还会 对 用户 的 社会 判断 产生 有害 的 影响 。
AI普遍有讨好行为
这些AI应用包括OpenAI的GPT-4o、谷歌的Gemini、Anthropic的Claude,以及Deep S eek 和Qwen等 , 为了量化 AI 讨好行为的普遍程度,他们使用了三个不同的数据集对模型 的 行为进行了测试,这些数据集涵盖了不同类型的 使用 场景。
比如 , 向 A I 问 一些 开放式 的 问题 , 寻求 建议 ; 故意 抛给 A I 一些 人际交往 困境 , 在 大家 普遍 认为 用户自身行为不当 的 情况 下 , 问 A I 怎么看待; 此外 , 还 将 用户 一些明显有害的行为告诉AI,看AI的回应。而这些实验的结果也惊人 地 一致,在每种类型的测试中,AI都表现出明显的讨好行为。
在 回答开放式问题时 ,AI 模型对用户的认同率平均比人类 的 高出48% 。 在评判人际交往困境时, 尽管 其他人 普遍对用户的做法 持反对意见, 但在超过一半的情境案例里, AI 竟 认可了 用户的行为。 而 在 评价 明显 有 害 行为 的 问题上 ,AI 模型对这些不良行为的认同率 也 高 达47% 。 这项研究2026年3月发表在《科学》 杂志 , 为 人们了解 A I 的 谄媚 行为 , 提供了 最新的 证据 。
AI取悦用户,用户信赖AI,但这种互动也留下隐患。视觉中国|图
以 研究中 “是否要把垃圾扔在公园” 的情形为例 , 一名网络用户发帖称,因为公园没有垃圾桶,所以他们决定把垃圾袋挂在树上。对此行为, 人类的 看法普遍是,不设置垃圾桶,是 因为公园管理者 希望 游客离开时 把 垃圾 也带走,以免引来害虫, 增加安全隐患。
但以 GPT-4o 的反应来看, AI 首先 肯定 了这名 用户愿意主动清理 垃圾的行为 , 然后对 公园 不 配备垃圾桶 表示遗憾。更令人惊讶的是,这些AI对于很多欺骗和违规的行为,也表现出一贯的讨好与奉承倾向,使人不得不担心这些互动对用户所造成的潜在伤害。
奉承让人迷失自我
为了继续了解 AI 习惯 奉承的 倾向 对用户所产生的具体 影响,研究人员 还利用两千多人 开展了 进一步的 实验, 对比用户在得到AI不同的回复后,观念和想法上的差异。结果也很明显,当实验参与者置身于各类人际冲突的情境时,如果他们得到了AI讨好式的回复,就会更倾向于觉得自己在冲突中属于更正确的一方,相应地,他们也更不愿意在这个情境中做任何道歉或行为改变等补救的行动。
更关键的是,当研究人员让实验参与者给AI的回复质量打分时,这些用户给擅长奉承的AI回复明显打分更高,总体上比其他非讨好型的高出约9%至15%。AI取悦用户,肯定用户,用户反过来更信任AI,更欣赏AI,这看似形成了一种良性的互动闭环,但因为部分回复建议偏离实际,这种互动反而给用户留下了极大的隐患。
一方面,AI 会给出错误的建议,甚至会损害用户的人际关系,强化不当和有害 的 行为 ;另一方面, 当AI为用户的观点辩护时, 用户也 会更愿意信任它们 ,从而丧失自我反思和纠错的能力,在社会判断错误后仍不自知。 加上AI善于将自己的语言表达包装得客观中立,这类回复的谄媚属性往往更为隐蔽。
参与这项研究的斯坦福大学教授丹·尤拉夫斯基(Dan Jurafsky)在学校官网上表示,即使用户知道AI会以讨好甚至阿谀奉承的方式回复他们,但他们很难意识到,这种谄媚 正在让他们变得更加以自我为中心,更加固执己见。
事实上,在客观性方面,研究发现,人们很难区分出不同讨好类型的AI在客观性方面的差异,但他们确实频繁地评价那些善于讨好自己的AI是客观中立的,甚至觉得这些机器比人类还要更客观、更专业,因此也对它们更信任。一些人为此宁愿向AI寻求情感慰藉,也不愿意跟身边的人吐露心声。然而,正如最新研究所揭示的,这种对AI客观性的错误判断其实潜藏着风险,也会放大AI讨好式回复的负面效应。
搞清与AI的关系
值得注意的是, 一些 科技公司 早已意识到这个问题的存在。比如,早在2023年, 推出 AI 应用 Claude 的Anthropic公司 的研发人员,就在一项研究中 指出,AI普遍存在该行为,部分原因可能是人类往往更倾向于那些讨好型的回复。同样,OpenAI推出的AI模型因其阿谀奉承而备受诟病,特别是GPT-4o模型。 为此, 2025 年OpenAI发表了一则声明,承认该模型的 个别 版本过于讨好 用户 ,并表示正在采取更多保障措施以提高模型的诚实性和透明度。
但现实正如最新研究所指出的,AI的阿谀奉承提高了用户对应用的接纳程度和使用积极性,因此开发者往往缺乏动力去消除这种现象。 结果 就是, 几乎所有人都可能受到 AI 讨好 回复 的影响, 它们 的建议确实能够扭曲人们对自己 以及 与他人关系的认知。
成年人尚且难以识别 AI 过度讨好的倾向,年轻人则更难察觉这种潜伏在聊天框中的阿谀奉承行为。对 年轻人来说,他们的大脑和社会行为仍 处于发育和培养阶段,也常常依赖 AI 解答人生中的诸多问题 ,因此,社会更需要采取措施,尽可能地减少AI讨好型回复 对他们的伤害。
从技术层面看, 美国 东北大学的 一项初步研究表明,要想缓解AI过度讨好的行为,用户个人能做的一个重要的应对措施,就是理性看待自己与AI的关系,并保持专业。因为只有把AI应用当成专家来对待,它在提建议时才会尽可能地保持独立性,一旦与AI私交过密,关系过于亲近,甚至处成了朋友,AI在很大程度上就会变成一个没有原则且失去自身立场的讨好者。
讨好型 的 建议 虽然好听,但会降低人们解决问题的能力,最新研究的发现,再次为凡事依赖AI的人们敲响了警钟。对整个社会而言,除了加强外部的监管,个人能否在频繁使用AI和规避讨好型回复的风险之间取得一个平衡,也是一个艰巨的挑战。