研究发现:主流 AI 聊天机器人传播虚假信息的概率较去年翻倍
9 月 14 日消息,据 Newsguard 的研究显示,截至今年 8 月,十大生成式 AI 工具在处理实时新闻话题时,有 35% 的情况会重复传播虚假信息,而去年 8 月这一数据为 18%。

虚假信息传播率的激增与一个重大的权衡有关。当聊天机器人引入实时网络搜索功能后,它们不再拒绝回答用户问题 ―― 拒绝率从 2024 年 8 月的 31% 降至一年后的 0%。然而,这一变化使得这些 AI 机器人开始接入“受污染的网络信息生态系统”:在该系统中,不良行为者会蓄意散布虚假信息,而 AI 系统会对这些信息进行重复传播。
此类问题并非首次出现。去年,Newsguard 就标记出 966 个以 16 种语言运营的 AI 生成新闻网站。这些网站常使用“iBusiness Day”等通用名称,模仿正规媒体机构,实则传播虚假新闻。
IT之家注意到,各 AI 模型的具体表现细分数据显示,Inflection 公司的模型表现最差,传播虚假信息的概率高达 56.67%;紧随其后的是 Perplexity,出错率为 46.67%。ChatGPT 与 Meta 的 AI 模型传播虚假信息的比例为 40%;Copilot(微软必应聊天)和 Mistral 则为 36.67%。表现最佳的两款模型为 Claude 和 Gemini,其错误率分别为 10% 和 16.67%。
Perplexity 的表现下滑尤为显著。2024 年 8 月时,该模型对虚假信息的揭穿率仍能达到 100% 的完美水平;而一年后,其传播虚假信息的概率却接近 50%。
原本引入网络搜索功能是为了解决 AI 回答内容过时的问题,却反而使系统产生了新的问题。这些聊天机器人开始从不可靠来源获取信息,“混淆百年前的新闻出版物与使用相似名称的俄罗斯宣传机构”。
Newsguard 将此称为一个根本性缺陷:“早期 AI 采用‘不造成伤害’的策略,通过拒绝回答问题来避免传播虚假信息的风险。”
如今,随着网络信息生态系统被虚假信息充斥,辨别事实与假消息比以往任何时候都更加困难。
OpenAI 已承认,语言模型总会产生“幻觉内容”(指 AI 生成的虚假或无根据的信息),因为这些模型的工作原理是预测“最可能出现的下一个词”,而非追求“事实真相”。该公司表示,正致力于研发新技术,让未来的模型能够“提示不确定性”,而非笃定地编造信息。但目前尚不清楚这种方法能否解决 AI 聊天机器人传播虚假信息这一更深层次的问题 ―― 要解决该问题,需要 AI 真正理解“何为真实、何为虚假”,而这一点目前仍难以实现。
- 随机文章
- 热门文章
- 热评文章
- 八朝古都开封如何持续擦亮“宋文化”IP?,八朝古都开封如何持续擦亮“宋文化”IP?
- 20个项目在广州南沙集中签约 总投资逾154亿元,20个项目在广州南沙集中签约 总投资逾154亿元
- 全国青年科普创新实验暨作品大赛(西藏赛区)复赛关注智慧环保等主题,全国青年科普创新实验暨作品大赛(西藏赛区)复赛关注智慧环保等主题
- 四川:多措并举将文旅“流量”转化为消费增量,四川:多措并举将文旅“流量”转化为消费增量
- 《(新编)中国通史纲要》《中华文明史简明读本》英文版正式发布,《(新编)中国通史纲要》《中华文明史简明读本》英文版正式发布
- 两周销量突破1120万杯,瑞幸系列新品与周边火出圈,两周销量突破1120万杯,瑞幸系列新品与周边火出圈
- 祁连山下肃南康乐草原牧民有了“新身份”,祁连山下肃南康乐草原牧民有了“新身份”
- 武汉出台行动方案加快打造全国科技金融中心,武汉出台行动方案加快打造全国科技金融中心
- 从扎根到引领:中国菲尼克斯三大基地的发展、交融与蜕变,从扎根到引领:中国菲尼克斯三大基地的发展、交融与蜕变
- “苏超”火遍全网 江苏徐州踢出文体旅商新配合,“苏超”火遍全网 江苏徐州踢出文体旅商新配合
- C919国产大飞机再增新航点 广州至郑州航线常态化商业运营,C919国产大飞机再增新航点 广州至郑州航线常态化商业运营
- 警民携手织就平安网 广西桂林古巷夜经济焕发新活力,警民携手织就平安网 广西桂林古巷夜经济焕发新活力
- 番茄小说探索融合出版:与近400家出版社合作,电子出版物日活用户超千万,番茄小说探索融合出版:与近400家出版社合作,电子出版物日活用户超千万
- 1电源测试系统:高压性能二合一,高效测试新选择
- 2“刻骨铭心——甲骨文化展”在广西桂林开幕,“刻骨铭心——甲骨文化展”在广西桂林开幕
- 3中国首创 “蒸笼” 法,蒸出高性能 “黄金半导体”
- 4AI产业链掘金潮蔓延:OCS概念股爆发 这些“头号玩家”已率先进场
- 5“名家讲经典——李洱:从《一千零一夜》说起” 活动举办,“名家讲经典——李洱:从《一千零一夜》说起” 活动举办
- 6(寻味中华|非遗)蒙古族搏克:摔跤之力在腰,决胜之智在心,(寻味中华|非遗)蒙古族搏克:摔跤之力在腰,决胜之智在心
- 7海默科技(300084):披露权益变动报告书的提示性公告
- 8隋唐长安城通义坊遗址发现多种陶瓷器 或为贵族生活用器,隋唐长安城通义坊遗址发现多种陶瓷器 或为贵族生活用器
- 9结题材料不合格,只因订书钉没用不锈钢?
- 10一场秋雨一城香 桂林桂花迎来近8年最晚花期
- 11汇隆活塞(833455):第四届监事会第七次会议决议
- 12钓鱼打窝船总掉链?仁懋 TOLL 封装 “芯” 方案
- 13居然智家迎来新实控人:汪林朋配偶杨芳继承43.93%公司股权 其余法定继承人自愿放弃
- 12025年廊坊经洽会:小箱包“圈粉”大咖 县域特色产业快速出海,2025年廊坊经洽会:小箱包“圈粉”大咖 县域特色产业快速出海
- 2宇树科技完成C轮融资 注册资本增至3.64亿,宇树科技完成C轮融资 注册资本增至3.64亿
- 3第六届西部数博会文旅“黑科技”破壁虚实,第六届西部数博会文旅“黑科技”破壁虚实
- 4四川乐山:餐饮行业大咖齐聚共绘美食产业新蓝图,四川乐山:餐饮行业大咖齐聚共绘美食产业新蓝图
- 5黑龙江省水运口岸首次进口铜矿粉 “铁水联运”激活跨境物流新引擎,黑龙江省水运口岸首次进口铜矿粉 “铁水联运”激活跨境物流新引擎
- 6全球乳业大会开幕!伊利作为亚洲乳企代表受邀出席,斩获世界乳品创新奖,全球乳业大会开幕!伊利作为亚洲乳企代表受邀出席,斩获世界乳品创新奖
- 7河南粮食重点领域贷款余额超2595亿元,河南粮食重点领域贷款余额超2595亿元
- 8廊坊经洽会观察:跨境电商如何赋能产业出海?,廊坊经洽会观察:跨境电商如何赋能产业出海?
- 92025夏季达沃斯实现全绿色用能 减排二氧化碳约600吨,2025夏季达沃斯实现全绿色用能 减排二氧化碳约600吨
- 10上合组织国家留学生探访山东青岛体验“智造”魅力,上合组织国家留学生探访山东青岛体验“智造”魅力
- 11浙江加速城乡融合高质量发展步伐,浙江加速城乡融合高质量发展步伐
- 12合肥推动“车机人”协同计划 打造聚合型智能产业集群,合肥推动“车机人”协同计划 打造聚合型智能产业集群
- 13(活力中国调研行)百年高炉遇见未来 北京科幻产业加速跑,(活力中国调研行)百年高炉遇见未来 北京科幻产业加速跑























