近日,中国科学院软件研究所科研团队提出了小批量数据采样策略,可消除由不可观测变量语义引起的虚假关联对表征学习的干扰,来提升自监督学习模型分布外泛化能力。
自监督学习的分布外泛化能力是指模型在面对与训练数据分布不同的测试数据时,仍能够保持良好性能。简单来说,模型需要在“未见过”的数据分布上表现得和在训练数据上一样好。但是,有研究发现,自监督学习模型在训练过程中受到与学习任务无关的不可观测变量的语义干扰,从而削弱分布外泛化能力。
该研究基于因果效应估计等手段,提出小批量数据采样策略,来消除不可观测变量语义干扰的混杂影响。这一策略通过学习隐变量模型,来估计在给定“锚点”样本的条件下,不可观测语义变量的后验概率分布,将其记为平衡分数。进而,该策略将具有相同或相近平衡分数的样本对划分为同一个小批量数据集,确保每个小批量数据集内的不可观测语义变量与“锚点”样本在条件上是独立的,从而帮助模型避免学习到虚假关联,提升模型的分布外泛化能力。
进一步,该研究在基准数据集上进行了广泛实验。所有实验均仅替换批次生成机制,无需调整模型架构或超参数。实验显示,这一采样策略使当前主流自监督学习方法在各类评估任务上至少提高2%的表现。具体而言,在ImageNet 100和ImageNet的分类任务中,Top 1和Top 5准确率均超越自监督方法SOTA;在半监督场景下的分类任务中,Top 1和Top 5准确率分别提升超3%和2%;目标检测与实例分割迁移学习任务中,各项平均精度均获得稳定增益;对于Omniglot、miniImageNet和CIFAR FS等少样本转移学习任务,性能提升超5%。实验表明,这一采样策略可以弱化虚假关联、强化因果学习,并能够提升分布外泛化能力。
相关研究成果被CCF-A类人工智能顶级学术会议International Conference on Machine Learning(ICML-25)接收。
论文链接
党的十八大以来,我国教育对外开放积极谋求更高质量发展,取得显著成效,已成为推进教育强国建设的重要引擎。通过不断完善教育对外开放总体布局,统筹规划、重点推进,我国逐步形成了更全方位、更宽领 “黄金考点”“解题模板”等传统“干货”,为何无法激发学生们的学习热情?曾经参与过中考命题的教师李铭(化名)在广东省珠海市第八中学(以下简称“珠海八中”)任教时,遇到了教学生涯新挑战。 对住宿在校的学生来说,特别是留守学生,最缺的就是陪伴。在湖北省襄阳市谷城县一所乡镇学校,为了让初中生在校能安心睡觉、吃饭和学习,校长每天都坚持陪餐、陪寝,和学生住在一栋宿舍楼,尽可能地陪在 中国教育报-中国教育新闻网讯(记者 欧金昌 通讯员 吴长奎 吴耿 翁就胜)“村委宣传栏就张贴有学生资助政策,开学初资助工作人员还进村宣讲,我们足不出户就能了解资助政策。现在我家三个孩子都享受 中国教育报-中国教育新闻网讯(记者 冯丽)近日,由西安交通大学(以下简称“西安交大”)、西安高压电器研究院股份有限公司与西安西电开关电气有限公司产学研深度融合的团队联合研发的“环保型发电机 中国教育报-中国教育新闻网讯(记者 焦以璇)近日,上海师范大学天华学院举办第四届基础教育论坛,论坛以“战位铸魂,讲台育才:‘兵教师’师范生培养创新”为主题,展现了学院培养高质量“兵教师”的成果 。本文链接:软件所提出小批量数据采样策略http://www.sushuapos.com/show-12-1181-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。