AI心理推断能力或与人类相当

发布时间: 2024-05-23 17:30:39 来源：新华网

观看：198

新一期《自然·人类行为》发表论文显示，在测试追踪他人心理状态能力——也称心智理论（Theory of Mind）的任务中，两类大语言模型（LLM）在特定情况下的表现与人类相似，甚至更好。

心智理论对人类社交互动十分重要，是人类沟通交流和产生共鸣的关键。之前的研究表明，LLM这类人工智能（AI）可以解决复杂的认知任务，如多选决策。不过，人们一直不清楚LLM在心智理论任务（被认为是人类独有的能力）中的表现是否也能比肩人类。

此次，德国汉堡—埃彭多夫大学医学中心团队选择了能测试心智理论不同方面的任务，包括发现错误想法、理解间接言语以及识别失礼。他们随后比较了1907人与两个热门LLM家族——GPT和LLaMA2模型完成任务的能力。

团队发现，GPT模型在识别间接要求、错误想法和误导方面的表现能达到甚至超越人类平均水平，而LLaMA2的表现逊于人类水平；在识别失礼方面，LLaMA2强于人类但GPT表现不佳。研究人员指出，LLaMA2的成功是因为回答的偏见程度较低，而不是因为真的对失礼敏感；GPT看起来的失利，其实是因为对坚持结论的超保守态度，而不是因为推理错误。

研究团队认为，LLM在心智理论任务上的表现堪比人类，不等于它们具有人类般的“情商”，也不意味着它们能掌握心智理论。但他们也指出，这些结果是未来研究的重要基础，并建议进一步研究LLM在心理推断上的表现，以及这些表现会如何影响人类在人机交互中的认知。

新一期《自然·人类行为》发表论文显示，在测试追踪他人心理状态能力——也称心智理论（Theory of Mind）的任务中，两类大语言模型（LLM）在特定情况下的表现与人类相似，甚至更好。

心智理论对人类社交互动十分重要，是人类沟通交流和产生共鸣的关键。之前的研究表明，LLM这类人工智能（AI）可以解决复杂的认知任务，如多选决策。不过，人们一直不清楚LLM在心智理论任务（被认为是人类独有的能力）中的表现是否也能比肩人类。

此次，德国汉堡—埃彭多夫大学医学中心团队选择了能测试心智理论不同方面的任务，包括发现错误想法、理解间接言语以及识别失礼。他们随后比较了1907人与两个热门LLM家族——GPT和LLaMA2模型完成任务的能力。

团队发现，GPT模型在识别间接要求、错误想法和误导方面的表现能达到甚至超越人类平均水平，而LLaMA2的表现逊于人类水平；在识别失礼方面，LLaMA2强于人类但GPT表现不佳。研究人员指出，LLaMA2的成功是因为回答的偏见程度较低，而不是因为真的对失礼敏感；GPT看起来的失利，其实是因为对坚持结论的超保守态度，而不是因为推理错误。

研究团队认为，LLM在心智理论任务上的表现堪比人类，不等于它们具有人类般的“情商”，也不意味着它们能掌握心智理论。但他们也指出，这些结果是未来研究的重要基础，并建议进一步研究LLM在心理推断上的表现，以及这些表现会如何影响人类在人机交互中的认知。

北京时间凌晨4点至6点，英伟达联合创始人兼CEO黄仁勋发表主题演讲《见证AI的变革时刻》，正式拉开了2024年英伟达GTC大会的序幕。黄仁勋宣布，正式推出名为Blackwell的新一代AI图形处理器（G 　　诺贝尔化学奖获得者阿龙・切哈诺沃：做研究保持好奇心很重要　　中新网宁波3月17日电(林波)对于学生而言，如何找到研究的信心和价值，让他们有继续下去的动力？　　“做研究保持好奇心很重要。”3月17日，2004年诺贝尔化学科技日报从哈尔滨工业大学获悉，北京时间2024年3月20日8时31分28秒，“天都一号”“天都二号”通导技术试验星伴随探月工程四期鹊桥二号中继星任务搭乘长征八号遥三运载火箭从文昌航天发射场发射记者3月21日获悉，全球植物科学期刊《分子植物》刊载了中国科学家的最新研究，中国农业科学院作物科学研究所、国家南繁研究院与阿里达摩院（湖畔实验室）联合研发出全流程智慧育种平台，实现了育种数 “人工智能作为数字新基建重点建设方向，前景广阔，大有作为。今年的政府工作报告更首次提出开展‘人工智能+’行动，无疑将为人工智能技术在国内各行各业的广泛应用开启新篇章。”3月22 近日，民航华东地区管理局向峰飞科技公司颁发V2000CG无人驾驶航空器系统型号合格证，这也是中国民航系统颁发的首个无人驾驶吨级电动垂直起降航空器型号合格证。航空器型号合格证取证是保障航空。

本文链接：AI心理推断能力或与人类相当http://www.sushuapos.com/show-2-6170-0.html

声明：本网站为非营利性网站，本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：我国科学家首次揭示六角冰表面原子级分辨图像

下一篇：以新基建提升产业链供应链韧性和安全

AI心理推断能力或与人类相当

热门资讯

推荐资讯

科技最热文章