跨模态增益挖掘Transformer潜力epL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
Yiyuan 投稿epL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
量子位 | 公众号 QbitAIepL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
万万没想到,与任务无直接关联的多模态数据也能提升Transformer模型性能。epL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
比如训练一个图像分类模型,除了标注好类别的图像数据集,增加视频、音频、点云等模态数据,也能显著提升模型在图像分类上的性能。epL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
这样一来,在AI训练阶段就可以减少与特定任务直接相关的标注数据需求,可以节省大量成本,或在数据有限的任务上提供新解决思路。epL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
epL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
这个神奇的发现来自港中文MMLab和腾讯AI Lab的合作研究,相关论文已被CVPR 2024接收,引起广泛关注。epL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
epL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
从无关数据中学习有用知识
具体来说,团队提出了一种称为多模态通路(Multimodal Pathway)的新框架。epL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
该框架允许Transformer模型在处理特定模态的数据时,同时利用其他模态中的无关数据进行训练,从而在不增加额外推理成本的前提下显著提升模型性能。epL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
epL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
多模态通路的核心技术是跨模态重参数化 (Cross-Modal Re-parameterization)*。epL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
这一技术的创新之处在于,它通过结构上的智能重组,使得模型能够在保持原有计算成本的同时,增加从其他模态学习的能力。epL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
对于已经被广泛运用到多模态特征提取的Vision Transformer,团队关心的是这些神经网络中的主要线性层。epL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
epL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
具体来说,这一技术在模型的每一个线性层中引入了辅助模态的权重,这些权重通过可学习的参数进行调节,从而在不增加推理时间的情况下,实现模态间的知识迁移。epL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
epL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
如图所示,比如有不同模态的两个线性层FC和FC’, 那么跨模态结构重参数化就是要通过构建一个运算完全等价的线性层来承载两个模态的运算,在这里直接将来自不同模态的两部分权重 (W和W’)做线性组合(W+λW’)来平衡两个模态的权重对于目标模态的贡献。epL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
实验结果:跨模态增益挖掘Transformer潜力
在论文中,研究团队详细介绍了他们的实验设计和结果。epL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
在图像识别、点云处理、视频理解和音频分析等多个任务上应用了多模态通路技术,观察到多模态通路能够在12种不同的模态相互帮助的关系中实现一致的性能提升。epL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
epL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
例如,在ImageNet图像识别任务中,结合了点云数据的多模态通路Transformer模型,比传统的Transformer模型在识别准确率上提高了0.7%。epL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
与MAE预训练方法的各种改进相比,该方法无需高昂的计算成本来预训练1600 Epoch,而是直接在下游任务中微调,就能显著地提升模型性能。这充分展示了多模态学习在处理大规模复杂数据集时的强大潜力。epL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
研究人员还发现,跨模态知识迁移的效果不仅与模型参数规模有关,还可能与层次表示(Hierarchical Representation)能力密切相关。也就是越擅长学习层次化的抽象表示的模型,迁移效果就越好。epL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
更值得注意的是,该方法有效地证明了即使毫不相关的多模态数据之间,仍能存在着明显的多模态增益效果,这充分说明我们现在对多模态学习的理解与认知还有很大的提升空间。epL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
epL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
总的来说,这项研究不仅能够启发多模态学习在学术领域的发展,也为工业界提供了新的思路。通过利用现有的海量数据资源,即使这些数据与当前任务不直接相关,也能够为AI模型的训练带来积极的影响。epL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
这种方法为数据资源有限或难以标注的领域提供了新的解决方案,特别是在自动驾驶、医疗影像分析、自然语言处理等技术要求极高的领域,多模态通路技术的应用前景广阔。epL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
此外,这一研究还揭示了AI跨模态学习的新机制,推动了学界对于不同数据模态间交互和协同处理的深入理解。研究团队表示,未来他们将探索将多模态通路技术应用于卷积神经网络(CNN)和其他跨架构的AI系统,以进一步挖掘这一技术的潜力。epL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
论文地址:https://arxiv.org/abs/2401.14405epL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
项目网页:https://ailab-cvc.github.io/M2PT/epL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
开源代码:https://github.com/AILab-CVC/M2PTepL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
讲解视频:https://www.bilibili.com/video/BV1Sm41127eW/epL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
3月17日记者获悉,哈尔滨医科大学公共卫生学院副院长、教授田懋一与副研究员叶鹏鹏团队在一项研究中提出,应将预防老年人跌倒与国家基本公共卫生服务中各项服务流程融合起来。该研究全面梳理了
春,推也。从草从日,草春时生也。进入春日,人们时常能在大地回暖、万物复苏中见证旺盛的生命力。一起解锁空间站里的“春日关键词”,感受太空中的“春日力量”吧!春日关键词:温暖空间站内 四季如春
3月21日,由安徽省工业和信息化厅指导、中国光伏行业协会主办、阳光电源股份有限公司承办的“PAT2024爱光伏一生一世”先进技术研讨会在合肥举办。光储高压先进技术发布会现场。阳光电源股份有
3月21日上午,全球首列氢能源市域列车在中车长客股份公司(以下简称“中车长客”)试验线上进行了时速160公里满载运行试验。当日试验过程中,车以160公里/小时速度运行的列车,每公里实际运行平均能耗
3月24日是第29个世界防治结核病日,我国的宣传主题是“你我共同努力,终结结核流行”。在北京大学社会化媒体研究中心21日举办的“技术升级,加速我国终结结核流行进程”主题沙龙上,中国疾控中心结
科学杂志《成瘾》3月21日发表的一项新研究显示,刚开始吸烟和终生吸烟都可能增加腹部脂肪,特别是内脏脂肪。内脏脂肪与心脏病、糖尿病、中风和痴呆症的高风险有关。吸烟者相较于不吸烟者,通常体
。
本文链接:CVPR‘24:与任务无关的多模态数据也能提升Transformer性能|港中文&腾讯http://www.sushuapos.com/show-2-5642-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
上一篇: AI人才争夺战,华尔街入局:豪掷百万美元年薪抢人
下一篇: AI教母李飞飞首次创业!成立“空间智能”公司,已完成种子轮