设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

AI进化的“燃料”从哪来?答案就在“数据工厂”里

发布时间: 来源: 中央广播电视总台中国之声

 icP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM


icP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

当人工智能以惊人的速度重塑世界,你是否想过,支撑它不断进化的“燃料”从何而来?这个答案就藏在“数据工厂”的新兴业态里。它不像传统工厂那样生产钢铁或汽车,而是专门“生产”高质量的数据集,为AI大模型提供源源不断的“粮食”。icP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

国内部分企业率先试水“数据工厂”icP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在天津,有一座工厂格外特别。这里没有轰鸣的机器,取而代之的是一排排整齐的小格子间。每天,大约有50万条高质量数据从这里“下线”,这里是一家具身智能超级数据工厂。icP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

△示意图

这家工厂创始人许晋诚介绍,他们在整个手上搭载了接近4000个触觉传感器,也创造出了世界最小的角度编码器,手指弯曲的时候,对它的角度幅度去实时检测。icP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

借助能实时记录触觉、力觉的特质手套和数十组摄像头,这里生产的每一条数据都包含了视觉、触觉、音频、轨迹等多维信息。许晋诚说,这样的数据能让机器人在训练中不仅“看见”动作,还能“感受”细节。icP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“数据工厂”是什么?

然而,这仅仅是数据价值释放的冰山一角。当前,整个AI行业正面临一个巨大的瓶颈——高质量数据严重短缺。一个名为“数据工厂”的新兴事物,正试图成为这个瓶颈的破局者。它不像传统工厂那样生产汽车或手机,而是专门“生产”和“加工”数据,就是将散乱、原始的庞大数据资源,转化为人工智能可以直接吸收、高效利用的“高质量数据集”。icP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

北京交通大学信息管理理论与技术国际研究中心教授张向宏介绍,我们在农业社会效率很低,是因为没有基础设施。工业社会效率提高的一个很重要的突破点就是有了基础设施,我们有自来水、燃气的供应。icP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

△示意图

如今进入数智社会,数据成为核心生产要素,同样需要类似“水厂”“电厂”这样的基础设施来规模化供给,这就是“数据工厂”。icP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

张向宏表示,现在这些大模型,其实他们现在都遇到了这个问题了,原因就是数据就是那些公域数据,私域数据确实开发不出来,数据瓶颈非常的突出。icP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这个瓶颈导致了一个怪圈:一边是手握海量数据的企业“有数不采、采而不存、存而不加工”;另一边是渴求数据的大模型公司,不得不重复“自己打井自己喝”,从采集、清洗到标注全部自己来,成本高昂且效率低下。数据工厂,正是破局的关键。icP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“数据工厂”建设路径如何走?

我国的数据工厂建设之路该如何走?张向宏指出,数据工厂本身就有不同的形态,主要分为集中式、半集中式和分布式三种:icP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  • 集中式是统一采集、统一汇聚、统一加工。目前来看做数据工厂的,90%以上采取都是集中式的。icP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  • 半集中式是通用的技术根据不同的应用它搭建不同的平台。icP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  • 分布式是没有一个工厂的物理的形态,但是数据采存算管用这套技术就是数据编织技术,就数据虚拟化技术是一模一样的。icP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

业界认为,从长远看,能实现“数据可用不可见”的分布式数据工厂是必然趋势,因为它从根本上解决了数据持有者对安全和控制权的担忧。但短期内,三种模式将并行发展。icP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

政策出台助力数据生产与人工智能深度对接

国家层面,国家数据局、工业和信息化部、公安部、证监会2月7日联合发布《关于培育数据流通服务机构加快推进数据要素市场化价值化的意见》,首次明确我国将培育三类数据流通服务机构。三类数据流通服务机构包括:数据交易所(中心)、数据流通服务平台企业、数据商。《意见》中提出,支持各类数据流通服务机构加强与人工智能企业等合作,依托数据基础设施提供数据汇聚、治理、模型训练等服务。icP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

国务院发展研究中心研究员马源表示,当前人工智能企业普遍面临数据荒问题,现在数据流通服务机构就有了一个新的核心使命:汇聚、整合跨行业、跨领域的数据资源,促进数据供方和AI企业需求高效匹配。icP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

展望未来,数据工厂的意义远不止于为AI“供粮”。它将成为国家数据基础设施的核心单元。从天津数据车间里采集数据的传感手套,到构想中全国联动的数据基础设施网络,数据工厂正从一个前沿概念,快步走向产业现实。它或许没有传统工厂的喧嚣,但它“生产”出的数据洪流,必将无声却深刻地重塑我们的时代。icP速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

中国科学院院士、中国科学技术大学教授郭光灿团队在基于冷原子的量子存储实验研究中取得重要进展:该团队教授史保森、丁 近日,罗氏制药第三届支付创新大会在上海举办。本次活动以“同星共创,聚氏未来”为主题,汇聚了来自医药企业、商业保险 12月16日,纪念姜维壮教授诞辰百年学术研讨会暨中国财税史研究院2023年年会在中央财经大学召开。在会上,与会者深切缅怀我 中新网伦敦1月2日电 (彭欣怡)当地1月2日,英国气象局发布数据指出,2023年是英国自1884年有气象记录以来第二热的一年,仅 2日,世界华人数学家联盟2023年会在复旦大学开幕。这是世界华人数学家联盟年会首次在上海举行。当天,上海数学与交叉学 关于发布《中国博士后科学基金资助指南(2024年度)》的通知 中博基字〔2024〕2号 各省、自治区、直辖市及新疆生产 。

本文链接:AI进化的“燃料”从哪来?答案就在“数据工厂”里http://www.sushuapos.com/show-11-31588-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 90后卫星设计师的“三张图”

下一篇: 河北师范大学原校长苏宝荣逝世

热门资讯

推荐资讯

  • 日榜
  • 周榜
  • 月榜