设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

助力降低AI引文幻觉提升准确率 新款开源语言模型与人类专家相仿

发布时间: 来源:

  助力降低AI引文幻觉提升准确率 新款开源语言模型与人类专家相仿hXa速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  中新网北京2月5日电 (记者 孙自法)国际知名学术期刊《自然》最新发表一篇计算机科学论文称,研究人员开发出一个开源语言模型OpenScholar,其在进行准确文献综述方面可超越商用大语言模型(LLM)。在本项研究开展的实验中,GPT4o会在78%-90%的情况下出现引文幻觉,而OpenScholar的引文准确率却与人类专家相仿。hXa速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  论文作者指出,虽然OpenScholar后续仍需进一步优化,但该AI工具有望帮助科学家处理复杂且日益繁重的科学文献综述任务。hXa速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本项研究相关示意图(图片来自论文)。施普林格・自然 供图

  据介绍,科学文献综述对于支持循证决策、微调科学过程和引导新发现都很重要。然而,文献发表数量的增长使研究人员很难掌握全部资讯。大语言模型可以提供协助,但却很容易出错,如归因能力有限和引文幻觉。hXa速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  为了生成准确、全面、透明的科学文献综述,美国华盛顿大学Akari Asai、Hannaneh Hajishirzi和同事及合作者一起,研发推出了开源语言模型OpenScholar。该模型是专为科研任务设计的检索增强语言模型,其他系统也用过这个框架,但论文作者将其与一个包含4500万篇最新开放获取科研论文的专业数据库以及一个自我评估机制相结合,从而优化其输出。hXa速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  论文作者还创建了名为ScholarQABench的基准工具来评估文献综述的自动化。研究显示,OpenScholar的准确率比GPT4o和PaperQA2(一个文献综述工具)这类现有系统分别高出6.1%和5.5%。此外,OpenScholar生成的答案在50%到70%的情况下比专家注释器的答案更有用。hXa速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  这些研究结果和引文幻觉大幅下降,证明了OpenScholar有望支持和推动进一步研究工作。论文作者也提醒说,该AI系统仍有局限性,同时,基于语言模型的系统无法使科学文献综述完全自动化。因此,他们向学界同时开放ScholarQABench和OpenScholar,以鼓励进一步研究和优化。(完)hXa速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

3月21日是世界睡眠日,中国主题为“健康睡眠 人人共享”。近日发布的《2023年中国居民睡眠白皮书》显示,我国居民平均睡眠时长6.75小时,平均在零点后入睡,夜间睡眠时长普遍偏短。你是否有睡眠困扰 记者3月20日从中国科学技术大学获悉,该校郭光灿院士团队在量子态分辨研究中取得重要进展:他们在最小资源消耗的量子态分辨问题中首次提出了全局最优自适应策略,并发展了自适应集体测量实验技术, 记者3月21日从核工业北京地质研究院(以下简称核地研院)获悉,该院自1959年成立以来,在天然铀保障、高放废物地质处置、核遥感技术与应用、分析测试等领域科技攻关,以及重点工程建设、国际合作交流 2024年2月,OpenAI公司推出了文生视频人工智能(AI)模型Sora。OpenAI展示了Sora利用少量简短文字提示即可创建逼真视频的能力,并提供了包括一位女士在闪烁着霓虹灯的东京街道漫步,以及一只狗在两个 3月25日消息,按照惯例,iPhone会在6月份的WWDC上发布iOS 18、watchOS 11、visionOS 2等全新系统。其中iOS 18比较受关注,被许多爆料者称为iOS史上最大升级。据名记Mark Gurman最新消息, iOS 18将支持 在近日开幕的中国国际核工业展览会上,中国核学会理事会党委书记、理事长王寿君表示,中国内地现有在运核电机组55台、居全球第三;在建核电机组26台,保持全球第一。这些成绩的取得,离不开智能化技术 。

本文链接:助力降低AI引文幻觉提升准确率 新款开源语言模型与人类专家相仿http://www.sushuapos.com/show-2-15235-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 【百家民企说】对话智元机器人姚卯青:人形机器人迈入部署元年

下一篇: 百度官宣派息并推出50亿美元回购计划 美股盘后涨近5%

热门资讯

推荐资讯

  • RICHARDMILLE理查米尔冰雪挚友天团集结共赴2026新征程

    一个月之前,RICHARD MILLE(理查米尔)宣布法国自由式滑雪新锐Arthur de Villaucourt成为品牌新任挚友。这位深耕雪上技巧项目的年轻运动员,将与Alexis Pinturault、Ester Ledeck

  • 德石股份副总经理离婚,“分手费”超1162万

      中新经纬2月6日电 德石股份6日晚间公告,公司于近日收到公司副总经理、董事会秘书王海斌的通知,王海斌与颜世明经友好协商,已办理解除婚姻关系手续,并就股份分割等事宜作出相

  • 央行:加快推进重点金融立法

      中新经纬2月6日电 据央行网站消息,2月4日,中国人民银行召开2026年金融法治工作会议。会议按照中国人民银行工作会议部署,总结工作,分析形势,研究部署2026年金融法治工作。 

  • 中国工商银行安徽省分行原副行长梁延国被开除党籍

      中新经纬2月6日电 中央纪委国家监委网站6日通报,据中央纪委国家监委驻中国工商银行纪检监察组、安徽省纪委监委消息:日前,中央纪委国家监委驻中国工商银行纪检监察组、安徽

  • 杭州联合银行贷款管理不到位等被罚1110万元

      中新经纬2月6日电 国家金融监督管理总局网站6日发布的行政处罚信息公开表显示,中信银行股份有限公司杭州分行(以下简称“中信银行杭州分行”)被罚款625万元,杭州联合农村

  • A股午盘翻红,化工板块集体走强

      中新经纬2月6日电 周五,A股市场早盘探底回升,三大指数集体翻红,此前一度跌超1%。  Wind截图  截至午盘,沪指涨0.11%,深成指涨0.65%,创业板指涨0.65%。  盘面上,锂电池、

  • “猪茅”牧原股份港股上市平开

      中新经纬2月6日电 6日,牧原股份港股上市,开盘持平。  Wind截图  牧原股份每股定价39港元。截至发稿,牧原股份涨1.23%,每股报39.48港元。  A股市场看,牧原股份现跌0.53%

  • A股三大指数集体低开,贵金属概念回调

      中新经纬2月6日电 周五,A股三大指数集体低开,沪指低开0.87%,深成指低开1.09%,创业板指低开1.15%。  Wind截图  盘面上,有色金属、油气、光伏等板块指数跌幅居前,低开个股

  • 外媒:韩国电商酷澎追加确认约16.5万余个账户信息外泄

      中新经纬2月5日电 据韩联社报道,韩国电商平台酷澎(Coupang)5日表示,在去年11月确认的用户个人信息外泄事件中,已追加确认约16.5万余个用户账户信息遭到泄露,规模远超此前公

  • 续贷到底要不要再查征信?真实经验告诉你避坑指南2026

    续贷到底要不要再查征信,这个问题其实很多人在操作信用卡循环贷、分期续期或者银行消费贷续贷时都会纠结。从实际经验来看,大部分情况下续贷是需

  • 最新权威综述:现有科学证据已十分完备,电子烟的减害价值不应被忽视

    近日,美国国家医学图书馆(NLM)发布的一篇毒理学综述报告引发关注,该报告直指公共卫生领域一直在忽视一个关键议题:目前已有明确科学证据表明,电子烟等减害产品比传统卷烟有显著的

  • 美图公司:2025年净利预增60%~66%

      中新经纬2月8日电 8日,美图公司在港交所披露最新财务业绩状况显示,2025年净利润预计同比增长60%~66%。  具体来看,公告显示,根据集团现有资料及董事会对本集团截至2025年1

  • 日榜
  • 周榜
  • 月榜