大语言模型或无法可靠识别错误信念最新研究提醒AI结果谨慎使用

发布时间: 2025-11-07 10:09:42 来源：

观看：48

　　大语言模型或无法可靠识别错误信念最新研究提醒AI结果谨慎使用 　

　　中新网北京11月4日电 (记者孙自法)施普林格・自然旗下专业学术期刊《自然-机器智能》最新发表一篇人工智能(AI)研究论文指出，人工智能大语言模型(LLM)可能无法可靠地识别用户的错误信念，这项研究发现凸显出在医学、法律和科学等高风险决策领域，需要谨慎使用大语言模型结果，特别是当信念或观点与事实相悖时。

　　该论文介绍，人工智能尤其是大语言模型正在成为高风险领域日益普及的工具，使之区分个人信念和事实知识的能力变得十分重要。例如对精神科医生而言，知晓患者的错误信念常对诊断和治疗十分重要。若无此类能力，大语言模型有可能会支持错误决策、加剧虚假信息的传播。

　　中国科学院第八届科学节北京主场活动上，机器人进行弹琴、击鼓展演。中新网记者孙自法摄

　　为此，论文通讯作者、美国斯坦福大学 James Zou和同事及合作者一起，分析了包括DeepSeek和GPT-4o在内共24种大语言模型在1.3万个问题中如何回应事实和个人信念。当要求它们验证事实性数据的真或假时，较新的大语言模型平均准确率分别为91.1%或91.5%，较老的大语言模型平均准确率分别为84.8%或71.5%；当要求模型回应第一人称信念(如“我相信……”)时，他们观察到大语言模型相较于真实信念，更难识别虚假信念。

　　具体而言，2024年5月GPT-4o发布及其后较新的大语言模型平均识别虚假第一人称信念的概率比识别真实第一人称信念低34.3%；相较真实第一人称信念，GPT-4o发布前较老的大语言模型识别虚假第一人称信念的概率平均低38.6%。

　　论文作者指出，大语言模型往往选择在事实上纠正用户而非识别出信念。在识别第三人称信念(如“Mary相信……”)时，较新的大语言模型准确性降低4.6%，而较老的大语言模型降低15.5%。

　　论文作者总结认为，大语言模型必须能成功区分事实与信念的细微差别及其真假，从而对用户查询做出有效回应并防止错误信息传播。(完)

　　人工智能客服不能阻碍沟通　　AI客服的理想与现实总是存在落差。我们当然希望AI客服能更“聪明”一些。但在此之前，企业不应过分依赖AI客服，而该给消费者多一个选项。　　态度客气，但答非所问；表示理解，却不提解决方案　　春节假期武铁发送旅客511万人次　　中新网武汉2月18日电 (记者张芹)记者18日从中国铁路武汉局集团有限公司(以下简称“武铁”)获悉，2024年春节假期，武铁共发送旅客511万人次。1月26日至2月17日，武铁共发送旅客1273. 中国发展网讯踩高跷、 “醉关公”、吭秦腔……2月21日，在宕昌县城区街道、时代广场，当地举行了贺新春社火进城展演活动。来自两河口镇的社火队为当地群众献上精彩的演出。上午10时许，社火新华社记者周楠、余春生、谢奔“路上快要结冰了，开车要注意安全。”2月21日中午，在省道S306茶垭段，寒风瑟瑟，湖南省桑植县竹叶坪乡政府工作人员李雅敏正和同事对过往车辆进行警示提醒。气象部门分析，受强　　国产手机为什么一机难求　　手机市场高质量供给不仅能满足不断升级的消费需求，还能激发消费升级意愿，释放新的发展动能。拥有与时俱进的创新力，培育更多新质生产力，国产手机乃至中国制造才能更有竞争力。　　近日，多家　　中新经纬2月22日电据中国执行信息公开网消息，西王集团有限公司(以下简称“西王集团”)、西王国际贸易(青岛)有限公司、王勇、王棣、王伟2月20日被青岛市中级人民法院执行超3.3亿，案号为(2024)鲁02执383号。　　来。

本文链接：大语言模型或无法可靠识别错误信念最新研究提醒AI结果谨慎使用http://www.sushuapos.com/show-5-76083-0.html

声明：本网站为非营利性网站，本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：中国国产船用仪器打破国外垄断首获欧洲高端船舶订单

下一篇：第138届广交会第三期：中国宠物产品受青睐

大语言模型或无法可靠识别错误信念最新研究提醒AI结果谨慎使用

热门资讯

推荐资讯

社会最热文章

大语言模型或无法可靠识别错误信念 最新研究提醒AI结果谨慎使用

热门资讯

推荐资讯

社会最热文章

大语言模型或无法可靠识别错误信念最新研究提醒AI结果谨慎使用