设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

GPT-4一眼看穿论文会不会撤稿:7000篇实测准确率高达95%|人大浙大

2024-04-09 17:16:14 来源: 量子位

大模型可能引发学术不端,也有办法维护科研诚信i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

阿踏 投稿i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

量子位 | 公众号 QbitAIi1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

把论文丢给GPT-4进行撤稿预测,和人类审稿人给出的结果相似性近95%i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

具体来说,来自人大与浙大学者团队的研究者们把涉及数千篇SCI/SSCI的期刊论文的10000多条推文喂给了GPT-4,让它根据推文回答“这篇论文是否有可能被撤稿”,然后和人类预测的结果相比较。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

结果,GPT-4几乎完美地胜任了这项工作。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

GPT-4一眼看穿论文会不会撤稿:7000篇实测准确率高达95%|人大浙大

也就是说,虽然近期偶有新闻冒出,有人直接把ChatGPT等大模型的生成内容复制进论文正文,进而引发一系列学术不端问题。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

但,大模型可能引发学术不端,也有办法维护科研诚信。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

论文作者Er-Te Zheng总结道:i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

AI能否应用于学术研究,这一问题的关键,在于AI工具如何被人类所使用。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

GPT-4一眼看穿论文会不会撤稿:7000篇实测准确率高达95%|人大浙大

推文能预测论文撤稿

作为让ChatGPT预测撤稿与否的基础,研究团队首先探索了“推文本身能否预测撤稿”。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

现实情况中,许多有问题的论文都是在推特等社交平台上被曝光,引发关注,继而被撤稿——比如前段时间争议不小的用AI绘制小鼠插图的论文。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

GPT-4一眼看穿论文会不会撤稿:7000篇实测准确率高达95%|人大浙大

在探索推文本身能否预测撤稿的过程中,团队搜集了一组包含3505篇撤稿论文的数据集,并采用粗略精确匹配方法获得的具有相似特征的3505篇未撤稿论文。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这些特征包括发表期刊、发表年份、作者数量和推文数量。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

上述7010篇论文的推文数据通过推特API收集,数据内容包括推文发布日期和文本内容。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

筛选出在论文撤稿前发布的推文后,研究团队最终共搜集到8367条涉及撤稿论文的英文推文和6180条涉及未撤稿论文的英文推文。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

GPT-4一眼看穿论文会不会撤稿:7000篇实测准确率高达95%|人大浙大

研究把推文分为训练集和测试集。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

训练集用来训练模型,然后在测试集上验证人工预测、关键词方法、机器学习模型和ChatGPT的预测结果情况。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

人工预测结果(研究者根据推文预测论文撤稿情况)是研究使用的主要基准之一,用以衡量模型与人工方法的一致性情况。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

人工预测结果显示,人类若认为推文暗示论文存在问题,则推文涉及的这篇论文有高达约93%的几率会被撤稿(精确率≈93%),这说明部分推文的确能够预测论文撤稿。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不过,像这样能通过推文被人工预测出撤稿的论文的总体占比不高,约占所有撤稿论文的16%(召回率≈16%)。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

因此,尽管只有一小部分撤稿论文的相关推文在论文撤稿前含有了可识别的问题信号,但这些信号确实存在i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

研究者观察到,能够有效预测论文撤稿的批评性推文有两种类型:i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  • 第一种直接突出论文中的错误或学术不端行为;
  • 第二种使用批评或讽刺的方式来突出论文的质量存疑。

这些推文能够促使期刊对论文进行调查,如果调查证实了推文中提到的问题的存在和严重性,论文随后可能会被撤稿。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在这种情况下,批评性推文可以作为撤稿论文的催化剂,强调了将其纳入研究诚信的早期预警系统的价值。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

ChatGPT预测结果95%近似人类

既然发现推文具有预测论文撤稿的潜力,研究进一步探索了关键词方法、机器学习模型和ChatGPT在根据推文来预测论文撤稿方面的潜力,将各模型的预测结果与人工预测结果进行比较。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

GPT-4一眼看穿论文会不会撤稿:7000篇实测准确率高达95%|人大浙大

研究表明,GPT-4的总体预测结果(包含撤稿预测和非撤稿预测)与人工预测结果的一致性最高,约95%。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

其次是GPT-3.5和SVM模型,其一致性超过80%。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而关键词方法与其他机器学习模型的一致性则在47%-64%之间,预测效果一般。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

精确率方面,同样是GPT-4的精确率最高:i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

GPT-4预测会撤稿的论文中,近70%的在人工预测中同样会撤稿;而其他模型的预测精确率均远低于GPT-4。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

GPT-4一眼看穿论文会不会撤稿:7000篇实测准确率高达95%|人大浙大

上图进一步显示了不同模型预测结果与人工预测结果的比较。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

关键词方法和三种机器学习模型(LR、RF和NB)将大量人工无法判定为撤稿的论文归为撤稿(过拟合率高)。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

相比而言,GPT-4的预测结果最接近于人工预测的结果i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

绝大部分GPT-4预测为撤稿的论文,人工预测也为撤稿,绝大部分GPT-4预测为非撤稿的论文,人工预测同样为非撤稿。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

有请实例

与其他方法相比,ChatGPT还有一个重要的优势——能够为其预测提供理由,而其他方法则无法详细解释其决策。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

例如,从样本论文中可以看出,ChatGPT对推文有深刻的理解,并能准确提取可能预测论文撤稿的信息,为使用推文评估论文是否存在潜在问题提供了宝贵的帮助。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

举个i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

GPT-4一眼看穿论文会不会撤稿:7000篇实测准确率高达95%|人大浙大

i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

GPT-4一眼看穿论文会不会撤稿:7000篇实测准确率高达95%|人大浙大

然而,也要注意到ChatGPT有时存在“幻觉”问题。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

也就是说,ChatGPT可能会产生不恰当的输出,因此在使用时需要谨慎,并考虑到其可能的错误预测。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

例如:i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

GPT-4一眼看穿论文会不会撤稿:7000篇实测准确率高达95%|人大浙大

样例论文3中,相关推文是对这篇论文的评价,暗示该论文指出诺奖得主的某篇论文存在问题。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

然而,ChatGPT将样例论文3误以为是被撤稿的诺奖得主的相关工作,因此这篇论文可能被撤稿。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

此处的分析结果表明,ChatGPT存在一定的逻辑推理谬误与过度解读等问题。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

因此,ChatGPT虽然能够通过推文从一定程度上预测论文撤稿,与人工预测的一致性在各模型中表现最好,但其在当前并非完美,在未来仍有长足的改进空间。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

网友对这项研究也挺关注,表示用ChatGPT预测论文撤稿,真是从未设想过的道路。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

因缺斯汀,我还以为没有足够多的数据来支撑这一结论呢!i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

GPT-4一眼看穿论文会不会撤稿:7000篇实测准确率高达95%|人大浙大GPT-4一眼看穿论文会不会撤稿:7000篇实测准确率高达95%|人大浙大

总体而言,研究揭示了社交媒体讨论作为论文撤稿早期预警的潜力,同时也展示了ChatGPT等生成式人工智能在促进科研诚信方面的潜在应用。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

研究作者介绍

最后,来认识一下这个研究的作者~i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Er-Te Zheng(郑尔特),人大信息资源管理学院硕士生,由Zhichao Fang助理教授指导;本科时,他在浙江大学获得管理学学士学位,师从Hui-Zhen Fu副教授。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

他的研究方向涉及计算社会科学、科学学和科学计量。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Hui-Zhen Fu(付慧真),浙大公共管理学院信息资源管理系副教授,北京大学博士。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

担任信息资源管理研究所副所长,荷兰莱顿大学科学技术研究中心(CWTS)访问学者。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

她的研究方向为交叉科学、科学计量、科研诚信和科研管理,在国际权威刊物发表论文超40篇(SCI/SSCI),连续四年(2020-2023)入选爱思唯尔中国高被引学者榜单。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Zhichao Fang(方志超),人大信息资源管理学院助理教授,荷兰莱顿大学科学与技术研究中心(CWTS)博士,莱顿大学CWTS客座研究员,伊朗波斯湾大学社交媒体数据研究组成员。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

他的研究方向为科学学、科学计量和社交媒体计量学,在科学计量学与科技政策等领域发表SCI/SSCI论文20篇。i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

论文链接:https://arxiv.org/abs/2403.16851i1w速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本文链接:GPT-4一眼看穿论文会不会撤稿:7000篇实测准确率高达95%|人大浙大http://www.sushuapos.com/show-2-4676-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 香港大模型公司Weitu AI首秀,打造多模态Native的技术和产品

下一篇: 北大开源最强aiXcoder-7B代码大模型!聚焦真实开发场景,专为企业私有部署设计

热门资讯

  • 全国爱肝日丨专家提醒注意“小心肝”

    3月18日是第24个“全国爱肝日”。今年活动的主题是,“早防早筛,远离肝硬化”。重庆多所医院开展义诊咨询活动,通过普及肝病的防治知识,让民众主动筛查

  • 数字化管理已在故宫广泛应用

    在今天的故宫,工作人员使用的数字化办公平台名叫“内务辅”,这款应用的开发者,是与故宫博物院合作的钉钉(中国)信息技术有限公司(以下简称“钉钉”)。3月1

  • 监管AI,欧盟出手,美国掉队?

      监管AI,欧盟出手,美国掉队?  上个世纪,科幻小说家艾萨克・阿西莫夫提出了“机器人三定律”,带来了对“机器人”与“规则”的美好幻想。  如今,伴随着ChatGPT、Sora的爆火,

  • 培育一批专利产业化样板企业

    近日,国家知识产权局等五部门联合印发了《专利产业化促进中小企业成长计划实施方案》(以下简称《实施方案》)。《实施方案》提出,到2025年底,中小企业知

  • 英伟达发布AI“超级芯片” 自称“非常、非常强大”

    据法新社3月18日报道,周一,美国半导体巨头英伟达公司发布了其最新型号的电子芯片,这些芯片旨在支持人工智能(AI)革命,英伟达正努力巩固其作为人工智能领

  • 自主研制!哈工大“天都二号”探月卫星成功发射

    科技日报从哈尔滨工业大学获悉,北京时间2024年3月20日8时31分28秒,“天都一号”“天都二号”通导技术试验星伴随探月工程四期鹊桥二号中继星任务搭乘

  • 一种新的结核病候选疫苗在南非启动Ⅲ期临床试验

    在3月24日世界防治结核病日前夕,比尔及梅琳达∙盖茨医学研究所(以下简称盖茨医学研究所)宣布,启动评估结核病候选疫苗M72有效性的Ⅲ期临床试验。在Ⅱb

  • 联合国机构报告称2022年全球产生6200万吨电子垃圾

    联合国机构3月20日发布的《全球电子垃圾监测》报告显示,2022年全球范围内共产生6200万吨电子垃圾,其中仅有不到四分之一被回收利用。报告显示,2022年

  • 人工纳米流体突触可实现存内计算

    瑞士洛桑联邦理工学院工程学院研究团队制造了一种用于内存的新型纳米流体设备,这使他们第一次能连接两个“人工突触”。该设备为受大脑启发的液体硬

  • “AI热潮”有人欢喜又有人忧:新兴市场遭资金外流!

      “AI热潮”有人欢喜又有人忧:新兴市场遭资金外流!  财联社3月20日讯(编辑 黄君芝)巴西亿万富翁、巴西金融公司Banco BTG Pactual SA创始人Andre Esteves表示,人工智能(AI

  • 英媒:人工智能助力抗体设计

    据英国《自然》周刊网站3月19日报道,研究人员首次利用生成式人工智能(AI)制造出全新抗体。报道称,本周生物学预印本资料库中的一份预印本报告的原理验

  • 北京市青少年科学教育基地揭牌

    为构建有效联动、密切配合的青少年科学教育协同机制,提升科学教育实施效能,3月23日,北京市关心下一代工作委员会(以下简称“北京市关工委”)、北京市科

推荐资讯

  • 日榜
  • 周榜
  • 月榜