设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

发布时间: 来源: 量子位

大智若愚了还是大于弱智了?0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

离大谱了,弱智吧登上正经AI论文,还成了最好的中文训练数据??0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

具体来说,使用弱智吧数据训练的大模型,跑分超过百科、知乎、豆瓣、小红书等平台,甚至是研究团队精心挑选的数据集。0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在问答、头脑风暴、分类、生成、总结、提取等8项测试中取得最高分0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

没错,论文中的Ruozhiba就是指百度贴吧弱智吧,一个充满荒谬、离奇、不合常理发言的中文社区,画风通常是这样的:0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

最离谱的是,弱智吧AI代码能力也超过了使用专业技术问答社区思否数据训练的AI,这下吧友自己都闹不明白了。0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

其他平台围观网友也纷纷蚌埠住。0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

这项研究来自中科院深圳先进技术研究院、中科院自动化研究所,滑铁卢大学等众多高校、研究机构联合团队。0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

作者之一也现身评论区,透露使用弱智吧数据训练AI属于灵机一动,以前只用来测试。0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

弱智吧数据究竟如何达成这一成就,具体到论文中看。0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智发言成指令微调神器

这项研究起初为解决中文大模型训练中的诸多问题0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  • 中文数据集很多是从英文翻译过来的,没有很好地契合中文的语言习惯和文化背景
  • 不少数据集是用AI生成的,质量难以保证,容易出现事实性错误
  • 即使是人工标注的数据集,也存在数据量小、覆盖领域不全面等问题

为了解决这些痛点,团队从中文互联网的各种知识源头直接收集数据,比如知乎、豆瓣、百科、小红书等,经过一系列严格的清洗和人工审核,打造成高质量、多样化的中文指令微调数据集COIG-CQIA0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

除了探索不同数据源的作用,团队还专门从中抽取出一个精华子集CQIA-Subset0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在众多数据来源中,弱智吧成了最特别的一个。0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

由500个点赞最高的帖子标题+人工或GPT-4的回复组成指令微调数据集, 经过人工审核后,最终留下了240组指令-回复数据对。0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

分别用各种数据集训练零一万物Yi系列开源大模型,在BELLE-Eval测试集上使用GPT-4评分得到结果。0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在规模较小的Yi-6B模型上,纯弱智吧版本总分排名第三,还不算太突出。0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

看来小模型还没能领悟弱智的精髓。0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

到了Yi-34B,弱智吧版本表现就一骑绝尘了。0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

只有在改写和数学任务上没能取得最高分,但成绩也比较靠前。0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

另外,在安全评估上弱智吧版本也能排上第二。0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

对于这类现象,研究人员在分析中也给出简单猜测:0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

当然弱智吧并不是这项研究的全部,它的真正贡献在于为中文大模型开发提供了一个高质量的指令微调数据集COIG-CQIA。0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

通过对各种中文互联网数据源的探索,这项研究为构建中文指令数据集提供了很多有益的启示。比如社交媒体数据虽然开放多样,但也存在不少有害信息风险;而百科类数据专业性强,但覆盖面可能不够广。0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧上大分

这项研究一发,网友集体笑不活。除了“XSWL、思路开阔了”婶儿的纯围观,也有网友认真讨论起了弱智吧有如此奇效的原因。0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

大伙儿都比较认可的一个原因是弱智吧题目的“异质”。0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

像脑筋急转弯,增加了指令多样性,所以提升了模型最终性能:0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

另一个原因是弱智吧数据文本质量很高,用词准确且简洁0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

千言万语汇成一句话:把弱智吧只当简单的段子合集真的是严重低估了它的价值!0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

雀食,要不此前弱智吧问题也经常被大伙儿用来测试大模型呢。0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

事实上从ChatGPT诞生之初,弱智吧就深度参与了大模型的发展,可以算是这一波AI浪潮的重要见证者了。0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

一开始只是网友拿来拷打AI,搞搞节目效果。0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

后来大家发现,弱智吧问题中充满陷阱,刚好可以用来分辨AI能力高低。0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

还记得23年初那会儿,各家大模型第一版还不太能很好应对这类问题,如2023年3月的文心一言:0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

后续版本也渐入佳境了,如2023年8月的文心一言:0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

知道今天,弱智吧问题都是每个新发布大模型都必须要过的一关,被戏称为弱智吧Benchmark。0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

秘塔写作猫0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

Inspo0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

再后来,AI公司们自己也开始重视起来,如百度官方就搞过联动直播。0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

当初网友为了调戏大模型专门搜集的弱智吧问题测试集,没想到有一天也能摇身一变,成了训练集。0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

思路确实是被打开了~0Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一

论文地址:
https://arxiv.org/abs/2403.180580Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

参考链接:
[1]https://x.com/9hills/status/17753589637245544100Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
[2]https://zhuanlan.zhihu.com/p/6906408640Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
[3]https://tieba.baidu.com/p/89649922470Js速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

据埃菲社报道,多发性骨髓瘤是成年人中继淋巴瘤之后第二常见的血液肿瘤。最近,西班牙的一个科研团队开发出了一种新的免疫疗法来对抗它。实验室实验表明,这种新疗法比目前优先使用的免疫疗法更有 据《自然》20日消息称,天文学家对91对恒星所作的光谱分析显示,大约每12个恒星中就有一个可能吞噬了一个行星。在吞噬一个行星后,恒星的化学构成可能发生改变,这个过程被称为“行星吸收”。通过比 记者3月20日来到广东深汕西高速公路改扩建施工现场,看到智能机器人、自动化生产线等智能制造设备在不停运行。3月19日—20日,由茅以升科技教育基金会和广东省交通集团联合主办的全国高速 春,推也。从草从日,草春时生也。进入春日,人们时常能在大地回暖、万物复苏中见证旺盛的生命力。一起解锁空间站里的“春日关键词”,感受太空中的“春日力量”吧!春日关键词:温暖空间站内 四季如春 “截至2023年底,与2018年同期相比,京津冀治理区浅层地下水位平均回升2.59米,深层承压水水位平均回升7.06米。”3月22日世界水日到来之际,水利部水资源管理司副司长张鸿星21日接受科技日报记者采 3月22日消息,中国互联网络信息中心(CNNIC)今天发布了《中国互联网络变化状况计算报告》。《报告》显示,截至2023年12月,我国网民规模达10.92亿人,较2022年12月新增网民2480万人,互联网普及率达77.5%。截 。

本文链接:弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一http://www.sushuapos.com/show-2-4574-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 峰会报名中|第二波嘉宾已就位,距离4月17日仅有两周

下一篇: 腾讯开源视频生成新工具,论文还没发先上代码的那种

热门资讯

  • 打造平台级AI 引领行业创新

    3月18日,荣耀在国内市场发布全新AI使能的全场景战略,推出平台级AI赋能、以人为中心的跨操作系统体验,以及与全球产业链共振创新的一系列智能设备。荣

  • 我研究人员提出 老年人防跌倒健康服务新视角

    3月17日记者获悉,哈尔滨医科大学公共卫生学院副院长、教授田懋一与副研究员叶鹏鹏团队在一项研究中提出,应将预防老年人跌倒与国家基本公共卫生服务

  • 负碳复合建材助力减缓全球变暖

    美国太平洋西北国家实验室的科学家设计了一种复合装饰材料,可以储存更多二氧化碳,提供了一种既符合建筑规范,又比标准复合饰面板便宜的“负碳”选择。

  • 迄今最大三维宇宙地图发布

    国际天文学家团队绘制了迄今最大的三维宇宙地图,记录了大约130万个活跃类星体在空间和时间上的位置。它将成为探测类星体、暗物质晕和超大质量黑洞

  • 我科学家实现最小资源消耗的量子态分辨

    记者3月20日从中国科学技术大学获悉,该校郭光灿院士团队在量子态分辨研究中取得重要进展。研究组在最小资源消耗的量子态分辨问题中首次提出了全局

  • 省电“神器”是“黑科技”还是智商税?

    3月15日,我国一些地区停止居民集中供热。初春时节,乍暖还寒。停暖初期昼夜温差较大,老人、儿童等身体较弱者,可能需要使用电暖气、电热毯等取暖设备,这

  • 女性比男性更易失眠?什么原因导致?专家分析

    造成女性更容易睡不好的原因是多方面的,包括更年期等生理周期等,而女性长期的失眠除了会导致内分泌进一步失调,还会诱发心脏病、高血压、糖尿病、免疫

  • 量子互联网:小荷已露尖尖角

    近日,美国纽约州立大学石溪分校科学家菲格罗阿等人在一篇发表于《自然·量子信息》上的论文中称,他们通过把两个独立的光子存储在铷气里,首次在

  • 我国成功发射云海二号02组卫星

      我国成功发射云海二号02组卫星  中新网北京3月21日电(马帅莎 曹译 张艳)北京时间2024年3月21日13时27分,我国在酒泉卫星发射中心使用长征二号丁运载火箭/远征三号上面

  • 首批量子测量领域国家标准发布

    随着量子技术的发展,利用量子特性突破传统测量技术极限的新一代精密测量技术——量子测量开始得到应用。记者从中国计量科学研究院获悉,由

  • 京东与OPPO重磅合作:销售额3年翻倍!

    3月23日消息,京东与OPPO战略合作协议签约仪式举行,双方签订未来三年OPPO在京东全渠道实现销售额同比增长100%的目标。在签约仪式上,OPPO高级副CEO、首席产

  • 聚焦AI框架技术创新 加速大模型规模化落地

    “人工智能作为数字新基建重点建设方向,前景广阔,大有作为。今年的政府工作报告更首次提出开展‘人工智能+’行动,无疑将为人工智能技术在

推荐资讯

  • “封关百日,有大企业主动谈合作”

      中新经纬3月27日电 (薛宇飞)“封关100天,我们有三批货物享受了加工增值内销免关税政策,节税8%。”27日,正大(海南)兴隆咖啡产业开发有限公司(下称正大兴隆)总经理叶剑对中

  • 2025年营收超72亿!从卫龙年报看魔芋品类的“狂飙”

      当“低卡”“低糖”“高纤维”成为年轻人零食消费的关键词,一种来自深山、曾经默默无闻的食材――魔芋,正在完成一场华丽的逆袭。  从火锅里的配角,到年轻人手边的“解馋

  • 商务部:扩大服务出口,拓展服务消费新空间

      中新经纬3月26日电 商务部新闻发言人何咏前表示,将更好优化入境消费环境,扩大服务出口,拓展服务消费新空间。  26日,商务部召开例行新闻发布会。会上有记者提问:近日,商务部

  • 官方:长期护理保险已拉动社会资本投入相关产业超600亿

      中新经纬3月26日电 26日,国新办就加快建立长期护理保险制度有关情况举行新闻发布会。国家医保局副局长王文君在发布会上介绍,据初步统计,自2016年试点以来,长期护理保险共拉

  • 雷军辞任金山云董事长

      中新经纬3月26日电 3月25日,金山云控股有限公司(下称“金山云”)发布公告称,雷军因其他工作安排,已辞任非执行董事,自3月25日生效。辞任非执行董事后,雷军亦不再担任董事长、

  • 工信部:前2月电信业务收入同比降1.7%

      中新经纬3月25日电 工信部网站25日披露2026年前2个月通信业经济运行情况。其中提到,前2个月,电信业务收入累计完成2904亿元,同比下降1.7%。  工信部称,前2个月,通信业运行

  • 中上协:2月末全市场总市值再创新高,同比增34%

      中新经纬3月25日电 25日,“中国上市公司协会”微信号发布统计月报。  截至2026年2月28日,境内股票市场(以下简称“全市场”)共有上市公司5492家,沪、深、北证券交易所分

  • 国家能源局:截至2月底太阳能发电装机容量同比增33.2%

      中新经纬3月25日电 “国家能源局”微信号25日消息,截至2月底,太阳能发电装机容量12.3亿千瓦,同比增长33.2%。  国家能源局当日发布2026年1-2月份全国电力统计数据。  

  • 外媒:OpenAI关闭短视频应用Sora

      中新经纬3月25日电 据美国消费者新闻与商业频道(CNBC)报道,当地时间周二,OpenAI宣布关闭短视频应用Sora。  “我们要和Sora说再见了。感谢所有与Sora一起创造作品、分享

  • 纳指收跌0.84%,国际油价大涨超4%

      中新经纬3月25日电 美股走势较为疲软。道指、标普500指数盘中数度翻红,但收盘集体走弱。道指收跌0.18%,纳指跌0.84%,标普500指数跌0.37%。  来源:Wind  “目前中东局势

  • 7连板华电辽能:股票存短期大幅下跌风险

      中新经纬3月24日电 7连板华电辽能24日晚披露严重异动公告,公司股票交易风险较大,存在短期大幅下跌的风险。  公告显示,截至2026年3月24日收盘,公司股票连续10个交易日内(2

  • 两高:农民工追索劳动报酬诉讼困难等可申请民事支持起诉

      中新经纬3月24日电 “最高人民法院”微信号24日消息,为依法办理民事支持起诉案件,保障当事人平等行使诉权,维护社会公平正义,近日,最高人民法院、最高人民检察院联合印发《关

  • 日榜
  • 周榜
  • 月榜