科学家找到提升元学习泛化性能新方法

发布时间: 2024-08-19 07:34:52 来源：中国科学报

观看：140

近日，中国科学院软件研究所天基综合信息系统全国重点实验室研究团队的一项研究成果，聚焦元学习的学习机制与任务采样，有助于模型泛化与迁移性能的提升，被被人工智能领域顶级国际会议IJCAI接收。

元学习旨在从有限的数据中构建多样化的训练任务来学习一般知识，然后迁移到新的任务中。传统观点认为，训练任务越多样，模型的泛化能力越好。然而，研究团队通过结构因果模型实验发现，在元学习机制下的任务最佳分类器不仅是利用因果因子进行决策，同时还会受到非因果因子的干预，即元学习中特定任务的因果因子和标签之间有虚假相关性，这些任务混杂因子会引起任务负迁移，从而影响泛化性能。

基于上述发现，研究团队提出了一种元学习因果表示学习器MetaCRL，用来消除任务混杂因子。MetaCRL由两个模块组成：解耦模块和因果模块。解耦模块首先通过学习语义矩阵获得整个生成因子，然后使用分组函数获取与每个任务相关的生成因子子集，旨在获得所有与任务相关的生成因子以及与单个任务相关的特定任务生成因子；因果模块则负责确保生成因子的真实因果关系，即基于因果不变性定理以及同一模型可以在不同分布中学习因果相关性，一方面是对表现出分布变化的多个训练数据集强制执行不变性，另一方面是通过简单的双层优化来保证解耦模块获得的语义矩阵和分组函数得到的生成因子具有真实因果关系。

MetaCRL能应用于各种元学习框架，通过交替优化MetaCRL与元学习模型，使元学习基于真实因果因子学习各种任务的通用知识，从而消除任务混杂因子。研究团队进一步在各种下游任务上进行了分类、回归、预测等广泛实验。结果表明，引入MetaCRL的各种元学习基线方法都获得了稳定的性能提升。此外，在多个基准数据集的知识迁移实验中进一步证明了MetaCRL消除任务混杂的有效性。

该论文共同第一作者为硕士生王婧瑶、副研究员任懿，通讯作者为特别研究助理强文文。

相关论文信息：https://arxiv.org/abs/2312.05771

代码地址：https://github.com/WangJingyao07/MetaCRL

·“Apollo开放平台9.0拥有极强场景通用能力，适配环节减少40% 、代码阅读量减少90%、代码调试量减少80%，可以实现‘ ■本报记者冯丽妃日本当地时间1月1日16时10分，日本西海岸石川县能登半岛发生7.6级地震，震源深度30公里。截至近日，日本政府批准了一项立法，要求6所顶尖大学成立新的管理政策委员会，使外部专家在决策中有更大的发言权。据《科编者按世界在变，变化中不断积蓄着突破的力量。局势纵横看似山重水复，历史规律昭示未来终将柳暗花明。2023年与我们挥关于公布2023年辽宁省自然科学学术成果奖评选结果的通知各市人力资源和社会保障局，省级学会（协会、研究会），市科学技术协省教育厅关于下达2024年普通高校“专转本”计划的通知苏教学函〔2023〕22号各有关高校：根据《省教育厅关于做好2024年。

本文链接：科学家找到提升元学习泛化性能新方法http://www.sushuapos.com/show-11-10089-0.html

声明：本网站为非营利性网站，本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：新研究揭示太平洋俯冲板片与上地幔变形特征

下一篇：香港特区政府医卫局局长：积极考虑建设香港第三所医学院

科学家找到提升元学习泛化性能新方法

热门资讯

推荐资讯

科学最热文章