设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

AI浪潮下的数据:自动驾驶需要何种标注?

2024-05-30 09:05:42 来源:

  AI浪潮下的数据:自动驾驶需要何种标注?Uxi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  自动驾驶是人工智能时代里最令人兴奋的科技之一。过去大约十年来,自动驾驶技术开始起步并得到一定程度发展,但目前仍然在等待里程碑式的突破,以期未来真正实现规模化应用。Uxi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  Holger Caesar是荷兰代尔夫特理工大学智能车辆组助理教授,他的学术生涯几乎和这一代自动驾驶浪潮同步启程,因此,他将过去约10年的时光专注在了这个领域的技术研究。其间,他在自动驾驶明星公司Motional作为项目负责人主导开发了自动驾驶数据集nuScenes和nuPlan,自2019年以来,这两个数据集也位居全球范围内最为使用广泛的开源自动驾驶数据集前列。Uxi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  事实上,数据是算法、算力之外第三驾驱动人工智能发展的马车,不少行业人士都认为,好的数据集十分难得,甚至是算力和算法发挥价值的前提条件。Uxi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  在人工智能新一轮浪潮来临时,Holger Caesar正致力于将自动驾驶数据集带向第三代。他告诉南方财经全媒体记者:“自动驾驶数据集的标注量可以缩小至目前水平的1/20至1/100,未来可能覆盖全球场景。”其中,基础模型的迅速发展带来了更便利的自动化,但带来的行业格局演变也正引起从业者的警惕。Uxi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  数据标注进入自动化的第三代Uxi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  “基于模型训练、减少人工标注,数据集应该是更加可拓展(scalable)、成本可负担(affordable)的。”5月末在上海,Holger向南方财经全媒体记者讲述了他开发三代自动驾驶数据集的经历。Uxi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  在自动驾驶数据集起步之初,数据采集的小时数、车辆行驶区域等均受到限制,而且所有的标注全由人力操作。第一代数据集nuScenes正是如此,它采样于波士顿和新加坡,总时长仅有5.5小时。Uxi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  尽管如此,这已经包含大量信息。这短短数小时的素材获取了1000个场景,同时涵盖北美洲和亚洲城市不同的路况和天气,也同时覆盖了左行和右行交通规则,其中,多雨的新加坡给数据标注带来了相当大的挑战。Uxi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  nuScenes也是全球首个全感应的数据集,这意味着它并非仅依靠相机或激光雷达采集数据,而是结合了二者以及雷达、GPS和IMU(惯性测量单元)数据。这个数据集最终包括140万张图片,其中在4万张关键图片中包含140万个标注框。Uxi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  从2016年到2019年,全球不同机构采集均使用人工方法为自动驾驶数据集进行标注,nuScenes的标注量已经足够说明,人工方法下的数据集建立有场景数量天花板(通常不超过1000个),而且开发时间长、人工培训成本高。尽管如此,初代数据集的开发令自动驾驶研发打开了局面。Uxi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  第二代数据集nuPlan是全球第一个大规模的规划型数据集,这一代数据加强了标注阶段的自动化,将数据集的小时数从5小时水平提升到1000小时以上。数据最终采集自波士顿、匹兹堡、拉斯维加斯和新加坡,包含1282个小时的行车数据。使用如此大的训练量,将数据集能力从感知(perception)提升到了规划(planning),也意味着将自动驾驶技术从低等级的辅助驾驶进一步提升到了自动驾驶能力。Uxi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  和上一代数据集不同的是,nuPlan将离线和实时数据进行了结合,利用离线感知(offline perception)进行了场景标记和交通灯模拟,更适合用于自动驾驶规划(planning)和预测(Prediction)。Uxi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  然而,底层离线感知系统仍然需要人力标注,这仍然导致数据集昂贵且耗时。Uxi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  目前,Holger设想第三代数据集将几乎不需要人类标注工作,这样可以极大降低数据集开发成本,并进一步提升可拓展性。“目前,全球仅有少数超大公司可以负担自动驾驶数据集开发,我希望能将AI开发进一步普及化,激发小公司和创新公司利用AI的能力。”Holger称。Uxi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  第三代数据集利用主动学习(active learning)、自监督学习(self supervised learning)、基础模型(foundation model)和语言模型(language model)等技术,这些方法可以将人力标注工作降低数个数量级,大约是上一代技术标注量的1/20至1/100。它还能灵活地适应新车辆、新城市等变量,未来可以开发有关自行车、火车和船只的新数据集。Uxi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  “未来,数据集开发方法还可以进一步应用到机器人、无人机、卫星、安防等领域。”Holger表示,这意味着自动驾驶领域的又一新技术将带来新的行业革命。Uxi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  人工智能令从业者兴奋Uxi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  人工智能为自动驾驶解决了一个又一个难题,令后者不再只是一个封闭场景里的幻想,而更可能在未来于广阔世界里成为现实。作为从业者,从2022年下半年开始的人工智能浪潮令他感到兴奋,同时新格局变化也令他产生了一些警惕。Uxi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  首先是基础模型经由“转换器(transformer)”改造以来,变得更加强大,适应大规模的神经网络模型建立,并产生了不少震撼市场的大语言模型和多模态模型。“Transformer的到来让人惊叹,它把数据集提升到了一个高得多的量级,分析能力也更强劲了。”Holger指出。Uxi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  Transformer是一种新型神经网络,大众熟知的ChatGPT、GPT系列模型、BERT模型等正是基于transformer开发的。Uxi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  目前,全球基础模型仍在不断开发,而这给数据标注带来了更多便利。Holger表示,这是因为基础模型能让图片训练适用于所有条件,也就是说,当天气、城市、摄像头等条件变化时,模型仍能自动训练。Uxi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  随着大语言模型在全球范围的流行,Holger认为这也可以给数据标注行业带来更多便利。“设想使用自然语言进行数据标注,例如对一张图片进行所有车辆标注,还能进一步修改标注目标,例如将图片中的卡车排除标注,这会令数据标注更加方便。”Holger称。Uxi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  除此以外,数据集训练也在更趋人道、环保和节能。由于在第三代数据集中使用自监督学习和主动学习,标注量成倍缩小。“从算力的角度,这更加高效,也意味着更节能环保。”Holger称,另外,数据标注行业从前几乎等同于“低薪高压”工作的代名词,未来也可能缩小这种工作量,转而增强职业训练技能。Uxi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  此外,新的模型训练也将覆盖更多的“边界情况(corner case)”,即那些不常见但对自动驾驶安全至关重要的场景,令自动驾驶真正从实验室里走到现实道路中。“在第三代技术中,我们正试图通过结合无监督学习去抓捕混合的车辆等,从而覆盖更多的‘边界’。”Holger称。Uxi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  不过,部分人工智能科技的发展正在悄然改变行业格局,这给从业者带来了一些关于未来的隐忧。Uxi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  算力硬件设备明显变得更加昂贵、供不应求,这是因为超大型人工智能公司正在囤积算力芯片,而部分公司拥有供应相关芯片的垄断地位。“未来的算力市场上,应该有更多公司供应算力芯片,而非只有一两家。”Holger表示。Uxi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  此外,“尽管基础模型的通用性非常强大,但这可能导致技术掌握在个别超大公司手中,这对于其他也在开发基础模型的创新机构不利。”Holger称。Uxi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  不过,Holger对大学和创新型研究机构在人工智能中的角色保持信心。“大型商业机构并不总是关心人工智能技术发展,因此这是我们(大学)发挥创新之处,我们也将把现有商用人工智能变得更加高效节能。”Holger称。Uxi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  商用AI可能会追逐周期浪潮,资金总是在行业高峰期进行堆积,但在行业低谷期撤退。Holger认为,人工智能发展也应该更加理性,一些热潮还需要时间验证。Uxi速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本文链接:AI浪潮下的数据:自动驾驶需要何种标注?http://www.sushuapos.com/show-5-16803-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 第四届红场镇茶叶文化节在汕头市潮南区举行

下一篇: 全球橙汁大危机!第一、第二大出口国灾害不断

热门资讯

  • 独家:创始人朋友圈说“为什么周六要休息”?三七互娱回应

      中新经纬1月11日电 (常涛)近日,一张三七互娱创始人、董事长李逸飞的朋友圈截图被热传。李逸飞在评论一篇文章时提到,“我们的父辈都是周六工作,为什么到我们就周六要休息,人

  • 今年春节假期琼州海峡客滚运输量较去年大幅增长

      今年春节假期琼州海峡客滚运输量较去年大幅增长  中新网广州2月19日电 (郭军 喻志专 赵卓)据交通运输部珠江航务管理局(简称“珠航局”)消息:2024年春节假期期间(2月10

  • 直播电商人才:是“野蛮生长”还是“学院派”培养

      直播电商人才:是“野蛮生长”还是“学院派”培养  在2024年寒假来临之前,北京电子科技职业学院电子商务(京东定向培养)专业的学生,迎来了一次直播实操培训课。  整个教

  • 老赖“要求美颜”露马脚被抓

      老赖“要求美颜”露马脚被抓  本报讯 记者黄辉 通讯员元春华 武慧慧 “能不能给我开个美颜?”被执行人在法院抖音里看到自己的失信行为被曝光后,竟然笑嘻嘻地在抖音评论

  • 春节档缘何爆发“撤档潮”

      春节档缘何爆发“撤档潮”  2024年春节档以80亿总票房打破多个纪录,迎来开门红。而8部影片有4部官宣“退档”,也为这个春节档带来了“史上罕见”的标签。一时全网哗然,#

  • 花式玩法点亮中国春节旅游市场

      (经济观察)花式玩法点亮中国春节旅游市场  中新社北京2月18日电 题:花式玩法点亮中国春节旅游市场  中新社记者 刘文文  餐厅爆满、景区门票售罄、热门酒店“一房

  • 天津重点监测商贸企业春节假期销售额同比增11.2%

      锦绣中国年 | 天津重点监测商贸企业春节假期销售额同比增11.2%  中新网天津2月18日电 (记者 王君妍 通讯员 王 张欣悦)今年春节假期为期8天,是一个“超级假期”,消费市

  • 海口秀英出台楼宇经济扶持政策 最高奖励300万元

    中国经济导报、中国发展网讯 为加快构建“一区三圈四园”产业发展新格局,发挥商务楼宇安商引商的引擎作用,2月21日,《海口市秀英区促进楼宇经济高质量发展扶

  • 湖北沙洋:技术指导深入田间地头施“良方” 应对低温雨雪冰冻天气

    为降低新一轮低温雨雪冰冻天气对农业生产带来的影响,湖北省沙洋县农业农村局组织技术服务指导组深入田间地头,重点围绕蔬菜大棚、油菜等主打产业,开展防冻避灾

  • 厦门筼筜湖的生态蝶变

    拼版照片:上图为20世纪80年代的厦门筼筜湖(资料照片);下图为2024年1月24日拍摄的厦门筼筜湖及周边城市景观(新华社记者姜克红摄,无人机照片)。新华社记者付敏城在

  • 我跨境电商占韩海外直购市场近半份额

      我跨境电商占韩海外直购市场近半份额  作者 杨明  凭借“高性价比”和“低物流费”等优势,中国跨境电商企业已占据韩国海外直购市场的近一半份额,本地化服务的提升也

  • “药械同追”试点项目助力医疗产品追溯标准化

      “药械同追”试点项目助力医疗产品追溯标准化  近日,全国首个GS1“药械同追”试点项目顺利通过中国物品编码中心的验收。该项目是以国际通用的GS1编码标准为基础建设的

推荐资讯

  • 日榜
  • 周榜
  • 月榜