戴着头戴式摄像头的孩子捕捉到的视频帧。图片来源:纽约大学数据科学中心
美国纽约大学研究人员开展了一项实验,他们通过一个孩子的眼睛和耳朵来训练多模式人工智能(AI)系统,使用的数据来自孩子6个月大到两岁生日期间的头戴摄像头的视频记录。发表在最新一期《科学》杂志上的该项研究表明,该模型或神经网络实际上可利用孩子经历的有限片段,学习大量的单词和概念。也就是说,视频只捕捉了孩子大约1%的清醒时间,但这对于真正的语言学习来说已经足够了。
GPT-4等AI系统现在可学习和使用人类语言,但它们从海量的语言输入中学习,远比儿童在学习如何理解和表达语言时接受的要多。最好的AI系统训练的文本数量达到数万亿字,而儿童每年只能收到数百万字的文本。
由于数据存在巨大差距,研究人员一直怀疑AI的最新进展能否反映出很多有关人类学习和发展的信息。此次,研究团队从孩子6个月大开始,到25个月大结束,每周通过头戴式摄像机,捕获其第一视角视频并分析。他们共使用了超过60小时的视频素材,包含大约25万个单词实例(即所传达的单词数量,其中许多是重复的)。这些单词实例与孩子在说出这些单词时所看到的视频帧相关联,包括进餐、读书和玩耍等各种不同的活动。
经过训练后,团队对模型进行了测试。他们向模型提供目标单词和四个不同的图像,要求它选择与目标单词匹配的答案。结果表明,该模型不但能够学习孩子日常经历中存在的大量单词和概念,还可以将它们概括为视觉实例,哪怕实例与模型训练中看到的完全不同。
由复旦大学发布的MOSS大模型一度引发关注,它背后的团队现在在关注哪方面的技术突破? 12月2日,中国软件领域规模最大、影 堆叠、扭曲铜酸盐超导体的示意图。图片来源:物理学家组织网 几十年来,超导体一直是物理学界研究的热点。但这些允许 69.3%的实验室获得性感染由程序性错误引起。大多数是操作失误或针头伤害。许多实验室失误归根到底是人为错误,这可能 中国科学院院士、中国科学技术大学教授郭光灿团队在基于冷原子的量子存储实验研究中取得重要进展:该团队教授史保森、丁 编者按 世界在变,变化中不断积蓄着突破的力量。局势纵横看似山重水复,历史规律昭示未来终将柳暗花明。2023年与我们挥 科技日报讯 (记者张梦然)美国罗切斯特大学研究人员报告了一种策略,用于了解在具有完全化学复杂性的溶剂中,分子如何失去 。本文链接:AI通过儿童眼睛和耳朵学习语言http://www.sushuapos.com/show-11-2643-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
上一篇: 《澳门植物物候》出版发行