中新网北京2月10日电 (记者 孙自法)施普林格·自然旗下专业学术期刊《自然-医学》最新发表一篇医学研究论文指出,基于人工智能(AI)技术的大语言模型(LLM),目前或许还不能协助公众做出更好的日常健康决策。研究人员认为,这类AI工具的未来设计需要更好地支持真实用户,才能安全用于向公众提供医学建议。
该论文介绍,全球医疗机构提议将大语言模型作为提升公众获取医疗信息的潜在工具,让个人在向医生求助前进行初步健康评估和疾病管理。但之前的研究显示,控制场景下在医师资格考试中得分很高的大语言模型,并不保证能有效完成真实世界的交互。
在本项研究中,英国牛津大学牛津互联网研究所研究团队与合作者一起,测试了大语言模型是否能协助公众精准辨别医疗病症,如普通感冒、贫血或胆结石,并选择一种行动方案,如呼叫救护车或联系全科医生。研究团队给1298名英国受试者每人指派了10种不同的医疗情景,并让他们随机使用三个大语言模型(GPT-4o、Llama3或Command R+)中的一个,或使用他们的常用资源(对照组),如互联网搜索引擎。
研究结果显示,不用人类受试者进行测试时,大语言模型能准确完成这些情景,平均能在94.9%的情况下正确辨别疾病,在56.3%的情况下选择正确的行动方案。不过,当受试者使用相同的大语言模型时,相关病症的识别率低于34.5%,选择正确行动方案的情况低于44.2%,这一结果未超过对照组。研究团队人工检查了其中30种情况的人类-大语言模型交互并发现,受试者常向模型提供不完整或不准确的信息,并且大语言模型有时也会生成误导性或错误的信息。
论文作者总结认为,当前的大语言模型未准备好部署用于直接的患者医疗,因为将大语言模型与人类用户配对,会产生现有基准测试和模拟交互无法预测到的问题。(完)
(原题:《国际研究:AI目前或不能协助公众做出更好日常健康决策》)
·“由于猫只在很短的时间内排出生物体,因此人类通过与它们一起生活的猫接触而感染弓形虫的机会相对较小。也就是 在庞大的维生素家族中,最为人所熟悉的恐怕就是维生素C了。 作为人体必需的维生素之一,维生素C因其具有的超强抗氧化 关于2023年第二批拟备案的省自然科学基金结题验收项目的公示 根据《河南省自然科学基金项目管理办法》(豫科〔2022 12月15日至16日,国家自然科学基金委员会管理科学部主办、首都经济贸易大学承办的数据要素与数字经济高层研讨会在首 近日发表于《睡眠医学》的一项研究表明,“夜猫子”动脉钙化的概率几乎是“早起鸟”的两倍。在心血管疾病的早期阶段, 据微信公众号“厦门大学管理学院”发布的讣告,中共党员、厦门大学退休干部,管理学院原院长沈艺峰教授于 2024年1月2日上午 。本文链接:AI目前或不能协助公众做出更好日常健康决策http://www.sushuapos.com/show-11-31725-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
上一篇: 柔性植入物能定向输药至不同脑区
下一篇: 片上天线实现高效太赫兹辐射