设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

何恺明刘壮新作:消除数据集偏差的十年之战

发布时间: 来源: 量子位

神经网络越来越强大,利用数据集偏差的能力也越来越厉害了yQP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

MIT新晋副教授何恺明,新作新鲜出炉:yQP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

瞄准一个横亘在AI发展之路上十年之久的问题:数据集偏差。yQP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

何恺明刘壮新作:消除数据集偏差的十年之战

该研究为何恺明在Meta期间与刘壮合作完成,他们在论文中指出:yQP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这不禁让人怀疑:我们在消除数据集偏差的战斗中,真的取得了胜利吗?yQP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

数据集偏差之战,在2011年由知名学者Antonio Torralba和Alyosha Efros提出——yQP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Alyosha Efros正是Sora两位一作博士小哥(Tim Brooks和William Peebles)的博士导师,而Antonio Torralba也在本科期间指导过Peebles。yQP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

当时他们发现,机器学习模型很容易“过拟合”到特定的数据集上,导致在其他数据集上表现不佳。yQP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

十多年过去了,尽管我们有了更大、更多样化的数据集,如ImageNet、YFCC100M、CC12M等,但这个问题似乎并没有得到根本解决。yQP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

反而,随着神经网络变得越来越强大,它们“挖掘”和利用数据集偏差的能力也越来越强了!yQP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

为了分析这个问题,何恺明团队设计了一个虚构的”数据集分类”任务。yQP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

听名字你可能就猜到了:给定一张图像,模型需要判断它来自哪个数据集。通过看模型在这个任务上的表现,就可以了解它们捕捉数据集偏差的能力。yQP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

何恺明刘壮新作:消除数据集偏差的十年之战

现代AI轻松识破不同数据集

在实验中团队发现,各种现代神经网络架构,如AlexNet、VGG、ResNet、ViT等,在数据集分类任务上表现出惊人的一致性:它们几乎都能以超过80%的准确率区分不同数据集的图像!yQP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

何恺明刘壮新作:消除数据集偏差的十年之战

更令人吃惊的是,这个发现在各种不同的条件下都非常稳健:yQP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不管是不同的数据集组合、不同的模型架构、不同的模型尺寸、不同的训练数据量,还是不同的数据增强方法,神经网络始终能轻松”一眼识破”图像的数据集来源。yQP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

那么,神经网络是如何做到这一点的呢?是靠单纯的记忆,还是学到了一些更普适的规律?yQP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

为了揭开谜底,团队做了一系列对比实验。他们发现,如果把不同的数据集随机混在一起,神经网络就很难再区分它们了(准确率下降到了33%)。这说明,神经网络并不是在单纯地记忆每一张图像,而是真的学到了一些数据集特有的模式。yQP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

何恺明刘壮新作:消除数据集偏差的十年之战

更有趣的是,即使在自监督学习的设置下,神经网络也展现出了惊人的”数据集辨识力”。在这种设置下,模型在训练时并没有用到任何数据集的标签信息,但当在这些自监督学习到的特征上训练一个简单的线性分类器时,它依然能以超过70%的准确率区分不同的数据集!yQP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

通过这一系列的实验,何恺明、刘壮等人的研究给我们敲响了警钟:尽管这十年我们一直在努力构建更大、更多样化的数据集,但数据集偏差这个问题似乎并没有得到根本解决。相反,现代神经网络越来越善于利用这些偏差来获得高准确率,但这可能并不代表它们真正学到了鲁棒、普适的视觉概念。yQP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

何恺明刘壮新作:消除数据集偏差的十年之战

论文的最后,作者呼吁整个AI社区重新审视数据集偏差这个问题,并重新思考如何在算法和数据两个层面上来应对这一挑战。yQP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

CVPR最佳论文作者的通力合作

本文是何恺明在Meta期间,与Meta研究科学家刘壮合作完成。yQP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

现在,何恺明已经正式在MIT上岗,担任电气工程与计算机科学系的助理教授。他的“开学第一课”开课即火爆,在youtube上已经有2.9万的播放量。yQP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

何恺明刘壮新作:消除数据集偏差的十年之战

和何恺明一样,刘壮本科毕业自清华,并且也是CVPR最佳论文奖得主——他是CVPR2017最佳论文DenseNet的第一作者。yQP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

2017年,刘壮从清华姚班毕业,进入加州大学伯克利分校攻读博士学位,师从Trevor Darrell,是贾扬清的同门师弟。yQP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

博士毕业后,刘壮进入Meta AI Research工作。在此之前,他已经在Meta实习了一年多时间,期间和谢赛宁合作,发表了ConvNeXt。yQP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

何恺明刘壮新作:消除数据集偏差的十年之战

论文地址:
https://arxiv.org/abs/2403.08632yQP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

参考链接:
https://twitter.com/liuzhuang1234/status/1768096508082008289yQP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

— 完 —yQP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  马斯克开源3140亿参数的Grok,大模型争相开源所为何求?  作者:刘晓洁  特斯拉CEO埃隆・马斯克(Elon Musk)给大模型领域投下一枚重磅炸弹。  北京时间3月18日凌晨,马斯克旗下大模型公司 xAI 在官网宣布开源 3140 肺癌是全球死亡率最高的恶性肿瘤。其中非小细胞肺癌(NSCLC)占比达到85%。表皮生长因子受体(EGFR)是NSCLC最常见的驱动突变基因。现在,一个国际科学家团队首次证明,EGFR的一个关键界面可能会成为更 21世纪经济报道记者孔海丽、实习生邓熙涵 北京报道“民以食为天,食与民同欢”,吃得健康、吃得安全是消费者长期以来的普遍共识。当代消费者已不止于填饱肚子,而是讲求“精耕细作”。消 所谓香喷喷的婴儿,到底是源于人们的爱意,还是说确有其香?《通讯·化学》21日一项小型研究首次分析了婴儿和青少年体味化学组成的差异。研究显示,有两种较难闻的化合物仅在青少年体味样本中 在日常生活中,隧道可以帮助人们翻山越岭。在植物细胞内,当内部物质穿过细胞膜时,往往也会通过类似的“隧道”。记者从中国科学技术大学获悉,该校孙林峰团队在第六大植物激素——油菜素 作为功能机时代的霸主,诺基亚手机曾经创造了巨大的辉煌,但也因错失智能手机发展机遇而“掉队”。近期,外媒Visual Capitalist统计了有史以来最畅销的15款手机型号,其中诺基亚和苹果包揽前十。今 。

本文链接:何恺明刘壮新作:消除数据集偏差的十年之战http://www.sushuapos.com/show-2-3865-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 来感受一下“人工智能+”,三甲医院是这样用大模型的

下一篇: 星舰失联了!SpaceX第三次发射功败垂成,但马斯克又把人类推进了一大步

热门资讯

  • 明天氢能荣获国家电网科技进步奖一等奖

    记者3月18日从安徽明天氢能科技股份有限公司(以下简称明天氢能)获悉,国家电网近日向明天氢能及董事长王朝云分别授予科学技术进步奖一等奖,获奖项目为

  • 监管AI,欧盟出手,美国掉队?

      监管AI,欧盟出手,美国掉队?  上个世纪,科幻小说家艾萨克・阿西莫夫提出了“机器人三定律”,带来了对“机器人”与“规则”的美好幻想。  如今,伴随着ChatGPT、Sora的爆火,

  • 创新中药八子补肾胶囊抗衰老研究取得重大突破

    3月20日对于我国抗衰老研究是个特殊的日子,经过近3年的不懈努力,八子补肾胶囊抗衰老取得又一重大突破。挑战人类生命极限是摆在全球科学家面前的重大

  • 新型催化剂为国内柴油发动机尾气氮氧化物处理补短板

    记者3月19日从天津大学获悉,该校环境学院刘庆岭教授团队与吉林大学于吉红院士团队以及天津工业大学梅东海教授团队合作,证明了无有机模板剂合成的具

  • 科学家提出人类性别决定新理论

    3月18日,记者从中南大学生殖与干细胞研究所获悉,研究所林戈、卢光琇教授团队提出的一项新理论称,原始生殖细胞的性染色体组成在人类性别决定中起关键

  • AI芯片巨头低调赚钱

      AI芯片巨头低调赚钱  骆轶琪  在过去一年半导体行业下行周期中,除了英伟达以GPU霸主身份实现业绩快速成长之外,另一些主营虽非GPU,但是立足于AI定制芯片市场的半导体巨

  • 30台发动机助进阶版“鹊桥”升空

      30台发动机助进阶版“鹊桥”升空  中新社西安3月20日电 (记者 张一辰)3月20日8时31分,长征八号遥三运载火箭在中国文昌航天发射场顺利升空,成功将“鹊桥二号”卫星送入

  • 被美国诉讼垄断:iPhone回应想让苹果变成安卓!iOS开放还怎么玩

    3月22日消息,美国司法部对iPhone提起诉讼,声称其苹果生态系统构成垄断。司法部表示,iPhone将苹果生态系统视为一种垄断,以牺牲消费者、开发者和竞争对手的

  • 首发第三代骁龙7+!一加Ace 3V图赏

    3月22日消息,一加Ace 3V昨晚发布,起售价1999元,将于3月25日正式发售。现在这款新机已经来到我们评测室,下面为大家带来图赏。一加Ace 3V全球首发第三代骁龙

  • 曝huaweiMate60已停产!P70蓄势待发:下个月见

    近日有消息称,huaweiMate60已经停产。作为huawei于2023年8月末发布的最新旗舰机型,huaweiMate60的停产意味着huawei新款旗舰或即将上市,接替Mate60。2023

  • 第三颗“厦门造”卫星出征

    3月23日,“天卫科技03星”暨“华祥苑壹号”卫星在厦门举行出征仪式,这是由厦门本土企业天卫科技制造研发的第三颗服务当地建设的商业卫星,标志着厦门

  • 吸烟会增加腹部脂肪

    科学杂志《成瘾》3月21日发表的一项新研究显示,刚开始吸烟和终生吸烟都可能增加腹部脂肪,特别是内脏脂肪。内脏脂肪与心脏病、糖尿病、中风和痴呆症

推荐资讯

  • 日榜
  • 周榜
  • 月榜