近日,中国科学院软件研究所科研团队提出了小批量数据采样策略,可消除由不可观测变量语义引起的虚假关联对表征学习的干扰,来提升自监督学习模型分布外泛化能力。
自监督学习的分布外泛化能力是指模型在面对与训练数据分布不同的测试数据时,仍能够保持良好性能。简单来说,模型需要在“未见过”的数据分布上表现得和在训练数据上一样好。但是,有研究发现,自监督学习模型在训练过程中受到与学习任务无关的不可观测变量的语义干扰,从而削弱分布外泛化能力。
该研究基于因果效应估计等手段,提出小批量数据采样策略,来消除不可观测变量语义干扰的混杂影响。这一策略通过学习隐变量模型,来估计在给定“锚点”样本的条件下,不可观测语义变量的后验概率分布,将其记为平衡分数。进而,该策略将具有相同或相近平衡分数的样本对划分为同一个小批量数据集,确保每个小批量数据集内的不可观测语义变量与“锚点”样本在条件上是独立的,从而帮助模型避免学习到虚假关联,提升模型的分布外泛化能力。
进一步,该研究在基准数据集上进行了广泛实验。所有实验均仅替换批次生成机制,无需调整模型架构或超参数。实验显示,这一采样策略使当前主流自监督学习方法在各类评估任务上至少提高2%的表现。具体而言,在ImageNet 100和ImageNet的分类任务中,Top 1和Top 5准确率均超越自监督方法SOTA;在半监督场景下的分类任务中,Top 1和Top 5准确率分别提升超3%和2%;目标检测与实例分割迁移学习任务中,各项平均精度均获得稳定增益;对于Omniglot、miniImageNet和CIFAR FS等少样本转移学习任务,性能提升超5%。实验表明,这一采样策略可以弱化虚假关联、强化因果学习,并能够提升分布外泛化能力。
相关研究成果被CCF-A类人工智能顶级学术会议International Conference on Machine Learning(ICML-25)接收。
论文链接
据《广州日报》消息,11月10日,广东实验中学举行建校100周年教育发展大会。广东省委教育工委书记、省教育厅党组书记林如鹏 本报9月30日综合消息 75载砥砺奋进,75载凯歌前行,75载春华秋实。在中华人民共和国75周年华诞到来之际,各地各校干部师生满怀喜悦和豪情,通过丰富多彩、形式多样的活动,共享荣光、共庆华诞,为全面推进教育强国建设积蓄前 中国教育报-中国教育新闻网讯(特约通讯员 苏勤)为推进国家通用语言文字普及工作,提高原民族语言授课学校教师国家通用语言文字教学水平,11月12日至14日,内蒙古教育厅举办全区原民族语言授课学校教 中国教育报-中国教育新闻网讯(记者 任朝霞)11月11日,以“AI for Science双螺旋引擎驱动科研新范式”为主题的2024科学智能创新论坛在复旦大学枫林校区举行。论坛上,上海科学智能研究院(简称“上智 习近平总书记在全国教育大会上强调,要深入推动教育对外开放,统筹“引进来”和“走出去”,不断提升我国教育的国际影响力、竞争力和话语权。南京工业职业技术大学前身是黄炎培先生于1918年创建的 中国教育报-中国教育新闻网讯(记者 欧金昌 通讯员 伍柳媛 陈昊华)日前,2024年世界职业院校技能大赛争夺赛高职组“智慧物流”赛项在广西职业技术学院举行,来自全国31个省(区、市)共63支队伍参赛。 。本文链接:软件所提出小批量数据采样策略http://www.sushuapos.com/show-12-1181-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。