设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

CVPR‘24:与任务无关的多模态数据也能提升Transformer性能|港中文&腾讯

发布时间: 来源: 量子位

跨模态增益挖掘Transformer潜力8Lc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Yiyuan 投稿8Lc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
量子位 | 公众号 QbitAI8Lc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

万万没想到,与任务无直接关联的多模态数据也能提升Transformer模型性能8Lc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

比如训练一个图像分类模型,除了标注好类别的图像数据集,增加视频、音频、点云等模态数据,也能显著提升模型在图像分类上的性能。8Lc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这样一来,在AI训练阶段就可以减少与特定任务直接相关的标注数据需求,可以节省大量成本,或在数据有限的任务上提供新解决思路。8Lc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

图片8Lc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这个神奇的发现来自港中文MMLab和腾讯AI Lab的合作研究,相关论文已被CVPR 2024接收,引起广泛关注。8Lc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

图片8Lc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

从无关数据中学习有用知识

具体来说,团队提出了一种称为多模态通路(Multimodal Pathway)的新框架。8Lc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

该框架允许Transformer模型在处理特定模态的数据时,同时利用其他模态中的无关数据进行训练,从而在不增加额外推理成本的前提下显著提升模型性能。8Lc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

图片8Lc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

多模态通路的核心技术是跨模态重参数化 (Cross-Modal Re-parameterization)*。8Lc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这一技术的创新之处在于,它通过结构上的智能重组,使得模型能够在保持原有计算成本的同时,增加从其他模态学习的能力。8Lc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

对于已经被广泛运用到多模态特征提取的Vision Transformer,团队关心的是这些神经网络中的主要线性层。8Lc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

图片8Lc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

具体来说,这一技术在模型的每一个线性层中引入了辅助模态的权重,这些权重通过可学习的参数进行调节,从而在不增加推理时间的情况下,实现模态间的知识迁移。8Lc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

图片8Lc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

如图所示,比如有不同模态的两个线性层FC和FC’, 那么跨模态结构重参数化就是要通过构建一个运算完全等价的线性层来承载两个模态的运算,在这里直接将来自不同模态的两部分权重 (W和W’)做线性组合(W+λW’)来平衡两个模态的权重对于目标模态的贡献。8Lc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

实验结果:跨模态增益挖掘Transformer潜力

在论文中,研究团队详细介绍了他们的实验设计和结果。8Lc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在图像识别、点云处理、视频理解和音频分析等多个任务上应用了多模态通路技术,观察到多模态通路能够在12种不同的模态相互帮助的关系中实现一致的性能提升8Lc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

图片8Lc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

例如,在ImageNet图像识别任务中,结合了点云数据的多模态通路Transformer模型,比传统的Transformer模型在识别准确率上提高了0.7%。8Lc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

与MAE预训练方法的各种改进相比,该方法无需高昂的计算成本来预训练1600 Epoch,而是直接在下游任务中微调,就能显著地提升模型性能。这充分展示了多模态学习在处理大规模复杂数据集时的强大潜力。8Lc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

研究人员还发现,跨模态知识迁移的效果不仅与模型参数规模有关,还可能与层次表示(Hierarchical Representation)能力密切相关。也就是越擅长学习层次化的抽象表示的模型,迁移效果就越好。8Lc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

更值得注意的是,该方法有效地证明了即使毫不相关的多模态数据之间,仍能存在着明显的多模态增益效果,这充分说明我们现在对多模态学习的理解与认知还有很大的提升空间。8Lc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

图片8Lc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

总的来说,这项研究不仅能够启发多模态学习在学术领域的发展,也为工业界提供了新的思路。通过利用现有的海量数据资源,即使这些数据与当前任务不直接相关,也能够为AI模型的训练带来积极的影响。8Lc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这种方法为数据资源有限或难以标注的领域提供了新的解决方案,特别是在自动驾驶、医疗影像分析、自然语言处理等技术要求极高的领域,多模态通路技术的应用前景广阔。8Lc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

此外,这一研究还揭示了AI跨模态学习的新机制,推动了学界对于不同数据模态间交互和协同处理的深入理解。研究团队表示,未来他们将探索将多模态通路技术应用于卷积神经网络(CNN)和其他跨架构的AI系统,以进一步挖掘这一技术的潜力。8Lc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

论文地址:https://arxiv.org/abs/2401.144058Lc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
项目网页:https://ailab-cvc.github.io/M2PT/8Lc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
开源代码:https://github.com/AILab-CVC/M2PT8Lc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
讲解视频:https://www.bilibili.com/video/BV1Sm41127eW/8Lc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

患者只需吸入特制的“氙气”,3.5秒后一幅人体肺部磁共振3D影像就呈现出来。影像中,气体可抵达肺部的位置清晰可见,患者的肺部微结构、气体交换功能情况等一目了然。日前,中国科学院精密测量科学 美国太平洋西北国家实验室的科学家设计了一种复合装饰材料,可以储存更多二氧化碳,提供了一种既符合建筑规范,又比标准复合饰面板便宜的“负碳”选择。研究人员于18日在美国化学会春季会议上公布 记者3月20日从西安交通大学第二附属医院获悉,该院皮肤病院夏育民教授科研团队研究设计了一种靶向抗双链抗体的D型模拟肽(D-ALW多肽)纳米微粒,成功应用于MRL/lpr红斑狼疮小鼠模型的治疗,为目前红斑 3月25日消息,去年huawei在Mate 60系列上首发了玄武机身架构,采用一体化金属机身,搭配上超耐用锦纤材质,使整机的抗挤压能力提高10倍,使用更放心。“玄武”是极其坚固的代表,huawei还在问界M9上采用了“ 今年3月23日是第64个世界气象日,主题是“气候行动最前线”。面对愈加频繁的极端天气和全球变暖等气候危机,减缓气候变化已刻不容缓。发展新能源是应对气候变化的重要举措之一,而气象服务对于新 “人工智能作为数字新基建重点建设方向,前景广阔,大有作为。今年的政府工作报告更首次提出开展‘人工智能+’行动,无疑将为人工智能技术在国内各行各业的广泛应用开启新篇章。”3月22 。

本文链接:CVPR‘24:与任务无关的多模态数据也能提升Transformer性能|港中文&腾讯http://www.sushuapos.com/show-2-5642-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: AI人才争夺战,华尔街入局:豪掷百万美元年薪抢人

下一篇: AI教母李飞飞首次创业!成立“空间智能”公司,已完成种子轮

热门资讯

推荐资讯

  • 官方:加强反垄断监管执法,深入整治“内卷式”竞争

      中新经纬3月26日电 据国家市场监督管理总局网站消息,市场监管总局召开2026年第一次企业公平竞争座谈会。  3月26日,市场监管总局召开2026年第一次企业公平竞争座谈会,围

  • 中央网信办:开展涉“未成年人”“仿冒假冒网站”等专项举报

      中新经纬3月26日电 据“网信中国”公众号26日消息,3月26日,中央网信办在四川宜宾召开全国网络举报工作会议。会议回顾总结2025年网络举报工作经验成效,研究部署2026年重点

  • 美股三大指数收涨!ARM涨超16%,国际油价跌超2%

      中新经纬3月26日电 国际油价回落,美国股市出现回暖。当地时间25日,美股三大指数集体收涨,道指涨0.66%,纳指涨0.77%,标普500指数涨0.54%。  美国大型科技股多数上涨,亚马逊涨

  • 三亚通报“两颗榴莲坑150”:情况属实,拟罚6万元

      中新经纬3月25日电 据微信号“三亚发布”25日消息,海南省三亚市综合行政执法局发布情况通报称,2026年3月22日,关注到有网民反映“两颗榴莲坑150 无照经营 遥控鬼称”的情况

  • 工信部:前2月电信业务收入同比降1.7%

      中新经纬3月25日电 工信部网站25日披露2026年前2个月通信业经济运行情况。其中提到,前2个月,电信业务收入累计完成2904亿元,同比下降1.7%。  工信部称,前2个月,通信业运行

  • 商务部:1-2月智能眼镜网零额增长183.5%

      中新经纬3月25日电 据商务部网站25日消息,商务部电子商务司负责人介绍2026年1-2月我国电子商务发展情况。  2026年1-2月,我国电子商务稳定发展,数字消费稳中向好,产业电商

  • 外媒:英国商业活动增长几近停滞

      中新经纬3月25日电 据英国《金融时报》中文网24日消息,美伊局势推高成本,英国商业活动增长几近停滞。  报道指出,一项备受关注的调查显示,英国商业活动正以自9月以来最慢

  • A股三大指数集体高开 贵金属板块领涨

      中新经纬3月25日电 周三,A股三大指数集体高开。上证指数涨0.28%,报3892.27点;深证成指涨0.98%,报13669.05点;创业板指涨1.10%,报3287.17点。  盘面上,行业板块中,贵金属、小金

  • 佰维存储斥资百亿签存储采购合同

      中新经纬3月25日电 深圳佰维存储科技股份有限公司(简称“佰维存储”)25日盘后公告,佰维存储与某存储原厂签订15亿美元的某款存储晶圆重大采购合同。来源:公告截图  具体

  • 中国中车等5户央企人事变动

      中新经纬3月24日电 “国资小新”微信号24日发布5户中央企业5名领导人员职务任免消息。  中国中车集团有限公司  王锋任中国中车集团有限公司党委副书记、董事,提名为

  • 多地二手房迎“小阳春”:刚需进场、老破小“真香”

      中新经纬3月24日电 (薛宇飞)“您昨天看的房子,今天卖掉了。”北京工作的郑玫(化名)在看完房子的第二天,房产经纪人就电话告知她,她看中的一套二手房源降价20万元成交了。 

  • 美联储维持利率不变!分析:美国经济“滞胀”加大决策难度|宅男财经

      【宅男财经|专家面对面】北京时间19日凌晨,美联储宣布将联邦基金利率维持在3.50%-3.75%区间不变。  东方金诚研究发展部高级副总监白雪对宅男财经表示,这一预期之所

  • 日榜
  • 周榜
  • 月榜