新晚报-AI为啥频频上演“一本正经胡说八道”

搜索数据，给出的内容查无实据；辅助诊疗，出现误判干扰治疗……

AI为啥频频上演“一本正经胡说八道”

字数：1,450 2025年09月25日时事

　　当前，AI正赋能千行百业，为人们的工作、学习、生活带来极大便利。与此同时，不少人发现，用AI搜索数据，给出的内容查无实据；用AI辅助诊疗，出现误判干扰正常治疗……AI频频上演“一本正经胡说八道”。社交平台上，AI幻觉引发热议。
　　AI不时像是“中邪”了
　　用AI检索海量信息、让AI辅助查看三维病灶、打造AI互动课堂……如今，AI已深度融入现代生活，“人工智能＋”产品赋能各行各业，从多个维度提供便利。
　　作为AI深度使用者，“95后”女生瑞希坦言，AI好用，但不时像“中邪”了一样胡说八道。“我让AI推荐10本高分小说，结果一多半都是它编的。反复确认后，它承认虚构了答案。”
　　现实生活中，不少人遇到相似情况。业内人士表示，这是由于AI幻觉导致。“AI可以快速给出答案，但生成内容可能与可验证事实不符，即凭空捏造；或生成内容与上下文缺乏关联，即答非所问。”一名主流人工智能厂商技术人员说。
　　社交平台上，AI幻觉相关话题浏览量达数百万，网友吐槽涉及金融、法律、医疗、学术等多个领域。
　　第三方咨询公司麦可思研究院近期发布的2025年高校师生AI应用及素养研究显示，四千余名受访高校师生中，近八成遇到过AI幻觉。
　　AI幻觉已经影响了人们的生活与工作。
　　近期，一名国外男子被诊断出溴中毒。他此前询问AI，过量食用食盐不利于身体健康，有无食盐替代品，AI回答称可以用溴化钠代替。但溴化钠存在一定毒性，需要严格遵医嘱服用。该男子用溴化钠代替食盐三个月后出现精神错乱等症状。
　　AI幻觉为什么会发生
　　受访专家认为，AI幻觉的背后存在多重因素。
　　——数据污染。AI“养成”过程中，数据“投喂”是关键环节。研究显示，当训练数据中有0.01％的虚假文本时，模型输出的有害内容会增加11.2％；即使是0.001％的虚假文本，其有害输出也会相应上升7.2％。
　　奇安信集团行业安全研究中心主任裴智勇解释说，人工智能大模型需要海量数据，训练数据来自开源网络，难免会错误学习一些虚假、谬误数据，还有一些不法分子会恶意进行“数据投毒”。
　　“如果把AI比作一个学生，数据污染就像是给学生看了错误的教科书，自然会导致‘胡说八道’。”暨南大学网络空间安全学院教授翁健说。
　　——AI本身“认知边界模糊”。翁健认为，人类智能的一个重要特征是“元认知”能力——知道自己懂什么、不懂什么，而当前AI技术架构缺乏这种自我认知机制。
　　翁健解释称，AI可以博览群书，但并不一定理解书里的内容，只是根据统计规律把最有可能的词语组合在一起，在准确评估自身输出的可信度方面尚存盲点。
　　——人为调校和干预。在中国通信学会数据安全专业委员会副主任委员左晓栋看来，相较于事实真相，AI更在意自己的回答是否契合用户需求，从而导致AI有时为了“讨好”用户而编造答案。
　　多方合力减少AI幻觉
　　第55次《中国互联网络发展状况统计报告》显示，截至去年12月，有2.49亿人使用过生成式人工智能产品，占整体人口的17.7％。受访专家表示，应通过多方合力应对AI幻觉带来的风险挑战。
　　今年4月，中央网信办印发通知，在全国范围内开展“清朗·整治AI技术滥用”专项行动，训练语料管理不严、未落实内容标识要求、利用AI制作发布谣言等均为整治重点。
　　“可靠、可信、高质量的数据对降低AI幻觉非常重要，应优化人工智能的训练语料，用‘好数据’生成‘优质内容’。”左晓栋认为，可以加快推动线下数据电子化，增加“投喂”的数据量；同时探索建立具有权威性的公共数据共享平台，“各大厂商也应加强优质数据筛选，提升训练准确性”。
　　翁健建议，建立国家级人工智能安全评测平台，就像生物医药新药上市前要做临床试验一样，大模型也应该经过严格测试；同时，相关平台加强AI生成内容审核，提升检测鉴伪能力。
　　据新华社电