设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

助力降低AI引文幻觉提升准确率 新款开源语言模型与人类专家相仿

发布时间: 2026-02-09 08:48:35 来源:

  助力降低AI引文幻觉提升准确率 新款开源语言模型与人类专家相仿PTO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  中新网北京2月5日电 (记者 孙自法)国际知名学术期刊《自然》最新发表一篇计算机科学论文称,研究人员开发出一个开源语言模型OpenScholar,其在进行准确文献综述方面可超越商用大语言模型(LLM)。在本项研究开展的实验中,GPT4o会在78%-90%的情况下出现引文幻觉,而OpenScholar的引文准确率却与人类专家相仿。PTO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  论文作者指出,虽然OpenScholar后续仍需进一步优化,但该AI工具有望帮助科学家处理复杂且日益繁重的科学文献综述任务。PTO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本项研究相关示意图(图片来自论文)。施普林格・自然 供图

  据介绍,科学文献综述对于支持循证决策、微调科学过程和引导新发现都很重要。然而,文献发表数量的增长使研究人员很难掌握全部资讯。大语言模型可以提供协助,但却很容易出错,如归因能力有限和引文幻觉。PTO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  为了生成准确、全面、透明的科学文献综述,美国华盛顿大学Akari Asai、Hannaneh Hajishirzi和同事及合作者一起,研发推出了开源语言模型OpenScholar。该模型是专为科研任务设计的检索增强语言模型,其他系统也用过这个框架,但论文作者将其与一个包含4500万篇最新开放获取科研论文的专业数据库以及一个自我评估机制相结合,从而优化其输出。PTO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  论文作者还创建了名为ScholarQABench的基准工具来评估文献综述的自动化。研究显示,OpenScholar的准确率比GPT4o和PaperQA2(一个文献综述工具)这类现有系统分别高出6.1%和5.5%。此外,OpenScholar生成的答案在50%到70%的情况下比专家注释器的答案更有用。PTO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  这些研究结果和引文幻觉大幅下降,证明了OpenScholar有望支持和推动进一步研究工作。论文作者也提醒说,该AI系统仍有局限性,同时,基于语言模型的系统无法使科学文献综述完全自动化。因此,他们向学界同时开放ScholarQABench和OpenScholar,以鼓励进一步研究和优化。(完)PTO速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

日前,盛世盈创氢能科技(陕西)有限公司(以下简称盛世盈创)与协氢(上海)新能源科技有限公司宣布达成战略合作,共同推进风冷氢燃料电池电堆全自动化生产线(以下简称风冷堆)的研发与生产。双方协议,将建设目 南方财经全媒体记者 吴立洋 上海报道日前,2024中国家电及消费电子博览会(AWE)在上海新国际博览中心闭幕。作为一年一度的家电产业盛会,AWE既是各大厂商展示新技术与新产品的重要节点,也是 据法新社3月18日报道,周一,美国半导体巨头英伟达公司发布了其最新型号的电子芯片,这些芯片旨在支持人工智能(AI)革命,英伟达正努力巩固其作为人工智能领域关键供应商的地位。“我们需要更加强大的 21世纪经济报道记者 蔡姝越 上海报道舆论高度关注的游族网络(002174.SZ)投毒案,幕后主使许垚如何量刑有了最新进展。3月22日,上海市第一中级人民法院(以下简称上海一中院)宣判被告人许垚故 一个国际团队近日在英国《自然》杂志上发表论文说,他们利用湖水样本培养出一种奇特的光合细菌,它属于绿弯菌门一种此前未知的目,代表了光合作用生物进化过程中的过渡形式。新发现为进一步探索远 3月22日,在2024低碳建筑产业论坛上,北京首例负碳示范建筑——首程时代中心负碳示范建筑正式亮相。活动现场,中国建筑节能协会、北京绿色交易所分别授予首程时代中心负碳示范建筑“零 。

本文链接:助力降低AI引文幻觉提升准确率 新款开源语言模型与人类专家相仿http://www.sushuapos.com/show-2-15235-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 【百家民企说】对话智元机器人姚卯青:人形机器人迈入部署元年

下一篇: 百度官宣派息并推出50亿美元回购计划 美股盘后涨近5%

热门资讯

推荐资讯

  • 日榜
  • 周榜
  • 月榜