助力降低AI引文幻觉提升准确率新款开源语言模型与人类专家相仿

发布时间: 2026-02-09 08:48:35 来源：

观看：77

　　助力降低AI引文幻觉提升准确率新款开源语言模型与人类专家相仿

　　中新网北京2月5日电 (记者孙自法)国际知名学术期刊《自然》最新发表一篇计算机科学论文称，研究人员开发出一个开源语言模型OpenScholar，其在进行准确文献综述方面可超越商用大语言模型(LLM)。在本项研究开展的实验中，GPT4o会在78%-90%的情况下出现引文幻觉，而OpenScholar的引文准确率却与人类专家相仿。

　　论文作者指出，虽然OpenScholar后续仍需进一步优化，但该AI工具有望帮助科学家处理复杂且日益繁重的科学文献综述任务。

本项研究相关示意图(图片来自论文)。施普林格・自然供图

　　据介绍，科学文献综述对于支持循证决策、微调科学过程和引导新发现都很重要。然而，文献发表数量的增长使研究人员很难掌握全部资讯。大语言模型可以提供协助，但却很容易出错，如归因能力有限和引文幻觉。

　　为了生成准确、全面、透明的科学文献综述，美国华盛顿大学Akari Asai、Hannaneh Hajishirzi和同事及合作者一起，研发推出了开源语言模型OpenScholar。该模型是专为科研任务设计的检索增强语言模型，其他系统也用过这个框架，但论文作者将其与一个包含4500万篇最新开放获取科研论文的专业数据库以及一个自我评估机制相结合，从而优化其输出。

　　论文作者还创建了名为ScholarQABench的基准工具来评估文献综述的自动化。研究显示，OpenScholar的准确率比GPT4o和PaperQA2(一个文献综述工具)这类现有系统分别高出6.1%和5.5%。此外，OpenScholar生成的答案在50%到70%的情况下比专家注释器的答案更有用。

　　这些研究结果和引文幻觉大幅下降，证明了OpenScholar有望支持和推动进一步研究工作。论文作者也提醒说，该AI系统仍有局限性，同时，基于语言模型的系统无法使科学文献综述完全自动化。因此，他们向学界同时开放ScholarQABench和OpenScholar，以鼓励进一步研究和优化。(完)

记者3月18日从兰州大学获悉，该校动物医学与生物安全学院郑海学教授团队解析了非洲猪瘟病毒（ASFV）在猪体内感染的靶细胞，以及在靶细胞内延长感染的机制。这项研究系统阐明了ASFV感染的细胞嗜性、 3月18日是第24个“全国爱肝日”。今年活动的主题是，“早防早筛，远离肝硬化”。重庆多所医院开展义诊咨询活动，通过普及肝病的防治知识，让民众主动筛查、规范治疗、定期随访，提高大众爱肝护肝意识，据英国《泰晤士报》网站3月15日报道，2020年1月，英国帝国理工学院的亚当·汉普希尔与英国广播公司合作，对8万人进行了30分钟的测试，目的是揭示生活方式的改变会影响我们的大脑功能。三个月今年1月，英国分子生物学家肖尔托·戴维发表文章，指控美国哈佛大学医学院附属丹娜-法伯癌症研究所科学家通过修改图片伪造数据。随后该研究所正式宣布撤回6篇论文，并纠正了另外31篇论文的 3月23日消息，荣耀Magic6 RSR 保时捷设计于3月22日正式开售，售价为9999元。该款电话首销当天即被抢购一空，荣耀商城显示，下一轮销售时间将是3月29日上午10:08。荣耀总裁赵明在微博上表示，荣耀Magic6 RS 近日，民航华东地区管理局向峰飞科技公司颁发V2000CG无人驾驶航空器系统型号合格证，这也是中国民航系统颁发的首个无人驾驶吨级电动垂直起降航空器型号合格证。航空器型号合格证取证是保障航空。

本文链接：助力降低AI引文幻觉提升准确率新款开源语言模型与人类专家相仿http://www.sushuapos.com/show-2-15235-0.html

声明：本网站为非营利性网站，本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：【百家民企说】对话智元机器人姚卯青：人形机器人迈入部署元年

下一篇：百度官宣派息并推出50亿美元回购计划美股盘后涨近5%

助力降低AI引文幻觉提升准确率新款开源语言模型与人类专家相仿

热门资讯

推荐资讯

科技最热文章

助力降低AI引文幻觉提升准确率 新款开源语言模型与人类专家相仿

热门资讯

推荐资讯

科技最热文章

助力降低AI引文幻觉提升准确率新款开源语言模型与人类专家相仿