DeepSeek回应内容返回异常:属特殊字符引发模型幻觉,不涉及安全问题
5月19日,DeepSeek正式发布说明,就近期用户反馈的模型内容返回异常问题作出公开回应,指出该异常系特殊字符引发的模型幻觉所致,不涉及任何安全问题或用户隐私泄露,同时承诺将通过针对性训练优化模型表现,彻底解决此类问题。
DeepSeek在声明中表示,技术团队经全面排查后发现,输入“< think> ”等字符触发返回异常内容,属于特殊字符引发的模型幻觉。后续将通过针对性训练增强模型对特殊字符的识别与处理能力,修复相关的已知问题,优化模型在此类场景中的表现。
此前,多位用户在社交媒体和技术论坛上反映,在使用DeepSeek网页版时遇到了问题。在新建的空白对话框中,仅输入“”或类似字符后发送,模型并不会报错或要求澄清,而是会开始输出一段段看似完整、但与当前对话上下文毫无关联的问答内容。这些内容包罗万象,涉及数学解题、物理概念解释、线性代数、命理推演乃至教育学分析等多个领域。
这些回答的措辞方式高度结构化,频繁出现“我们被问到……”或“需要询问……”等书面化、第三人称的引导句式。部分用户在测试中还看到了涉及个人生辰 八字 等敏感信息的生成内容,这进一步引发了用户对于“对话泄露”或“训练数据外泄”的担忧。
对此,DeepSeek技术团队将问题定性为“模型幻觉”。在人工智能领域,“幻觉”特指模型生成看似合理但事实上不正确或与输入无关信息的行为。此次事件中的特殊字符“”,在模型训练和内部推理过程中,很可能被用作一种特殊的指令标记或分隔符,用于引导模型进入“思维链”推理模式。
当普通用户在前端对话界面意外输入此字符时,模型错误地将其识别为系统指令,从而触发了一种非预期的行为模式:它可能试图补全一个它“认为”应该存在的、但用户并未实际提供的“问题”,进而从其庞大的预训练语料库中,随机抽取或生成一段结构化的问答内容进行输出。这并非调取了其他用户的实时对话记录,而是模型基于其训练数据中的概率分布所进行的“无中生有”的补全。