设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

解锁AI的3D叙事 李飞飞、谷歌先行一步

发布时间: 来源:

21世纪经济报道记者孔海丽 北京报道gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

AIGC的3D赛道突然热闹了起来。gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

12月5日,谷歌DeepMind放出了新一代世界模型Genie 2,可以“一张图生成1分钟游戏3D世界”,网友惊呼“黑客帝国来了”。gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

就在两天之前,“AI教母”李飞飞的World Labs刚官宣了“空间智能”模型,支持“一张图生成一个3D世界”。gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这是继Sora之后,对世界模型的又一次讨论热潮。从文本到图像,再到视频和可交互的3D世界,AIGC总体上有了重大飞跃。gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

对于产业端来说,创造性设计类工作和交互式体验工作流,都迎来了强大助力。世界模型可以为Agent训练、具身智能训练、复杂的动画制作、游戏制作、物理学建模等领域,提供无限多样、可操控的3D环境。gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

也有产业人士表示,世界模型的进展,意味着终极AGI(通用人工智能)又近了一步。gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

谷歌拓展通向AGI的广度

Genie 2是谷歌第二代世界模型,给定一张图像,就能生成一个通过键盘和鼠标输入的、可操作的3D环境。gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

图像中的角色,可以被键盘识别并响应智能操作。gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

同一个起始帧,可以生成不同的运动轨迹。gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Genie 2前后记忆具有一致性,周围场景即便不可见时,也不会发生扭曲。gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

可贵的是,Genie 2可以根据画面实时生成新场景,最长可达一分钟。gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这样的界面,和游戏有共通之处。gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“游戏在人工智能研究领域发挥着关键作用。它们引人入胜的画质、独特的挑战组合和可衡量的进步,成为安全测试和推进AI功能的理想环境。”谷歌方面坦陈:“事实上,游戏对谷歌DeepMind一直很重要,也是谷歌训练Agent的重要途径。”gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

但是对具身智能的训练,行业是遇到了瓶颈的。gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

足够丰富和多样化的训练环境,才能促进具身智能的实际进步。21世纪经济报道记者从人形机器人产业人士处获知,当前,泛化能力是人形机器人的一大痛点。gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Genie 2有望帮助具身智能解决训练瓶颈。gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

交互功能上,Genie 2可以对交互关系进行建模,例如爆破气球、打开门和射击炸药桶等。gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这使得制作多样化交互场景简单了许多。利用Genie 2快速构建的各种交互式体验原型,研究人员能够快速用新环境来训练和测试具身智能AI。gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

例如,使用Imagen 3生成的不同图像提示Genie 2对纸飞机、龙、鹰或降落伞飞行之间的区别进行建模,并测试Genie控制不同对象时的能力。gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

也就是说,AI智能体可以在世界模型里,获得近乎无限的训练场景和交互体系。gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

虽然这项研究还处于早期阶段,但谷歌研究人员认为,Genie 2是解决安全训练具身智能结构性问题的有效路径,解锁具身智能的下一波能力,也能够实现迈向AGI所需的广度和通用性。gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

李飞飞兑现空间智能设想

World Labs是著名AI学者、华裔科学家李飞飞的第一个创业项目,成立于2024年1月,公司创立半年时,估值已超10亿美元。gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这是一家空间智能公司,致力于构建能够感知、生成并与3D世界互动的大型世界模型,计划为用户生成可操控其中变量的虚拟3D空间,并允许人们“创建自己的3D世界”。World Labs指出,其软件将对包括艺术家、设计师、开发人员和工程师在内的各类从业者有所帮助。gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

12月3日,World Labs交出了1.0版本作业。gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

由单张图像可以生成3D世界,用户可以实质意义上“走进”任何图像,并在3D中探索。gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

该工具还配备了可操控的滑块,来调节模拟景深与模拟推拉变焦,支持调整摄像机的位置和视野、更改对象颜色,创建聚光灯特效、自动运行的动态效果等交互方式,丰富了视觉体验和更强的操控感。gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

与Genie 2一样,World Labs的空间智能模型也可以保证3D世界的一致性,场景更加持久,一旦生成便会一直存在;用户可以实时控制、实时移动场景,能够仔细观察场景中的细节。gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

世界模型遵循3D几何的基本物理规则,兼具真实感和深度感,有效提升了内容的操控性和一致性,改变了电影、游戏、模拟器以及物理世界其他数字呈现形式的制作方式。gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

英伟达高级研究科学家Jim Fan评价说:“GenAI正在创造越来越高维度的人类体验快照。Stable Diffusion是2D快照;Sora是2D+时间维度的快照;而World Labs是3D、完全沉浸式的快照。”gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

目前,Worldlabs对公众开放了候补名单申请,部分创作者已经可以将这个AI工具整合到现有的工作流程中。gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在影视制作领域,AI的3D叙事能力将大大提高内容创作的效率和质量,降低制作成本。创作者可以更快速地生成虚拟场景和角色,通过AI生成的3D世界来构建更加丰富多样的故事背景,为观众带来全新的视觉体验。gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

例如,在拍摄前利用Worldlabs技术生成虚拟的拍摄场景,帮助导演和摄影师更好地规划镜头和场景布置,提高拍摄效率和准确性。gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

对于游戏行业,3D生成将为游戏开发带来更多可能性。开发者可以利用AI生成更加逼真、细腻的游戏场景和角色,提升游戏的沉浸感。gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在教育领域,大模型生成的3D内容可以创建更加生动、直观的教学场景,增加科学、历史等学科的体验感。gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

李飞飞认为,“空间智能”是AI拼图的关键一环。她今年4月份在TED演讲中曾称:“视觉变成了洞察力;洞察力变成了理解力;理解力推动了行动。所有这些都产生了智能。”gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Genie 2和Worldlabs所代表的空间智能领域,是AI技术发展的一个重要新方向。它突破了传统AI在二维平面上的局限,将AI的感知和理解能力拓展到了三维空间,更直观,也更趋近于交互本质。gYN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

3月20日对于我国抗衰老研究是个特殊的日子,经过近3年的不懈努力,八子补肾胶囊抗衰老取得又一重大突破。挑战人类生命极限是摆在全球科学家面前的重大课题,抗衰老研究已成为世界生命科学领域关注 记者19日从兰州大学获悉,天华肉羊通过国家畜禽遗传资源委员会审定鉴定,成为我国首个适应高寒气候的肉羊品种。该品种由兰州大学草地农业科技学院李发弟教授和乐祥鹏教授团队,联合甘肃省武威市天 美国《发现》杂志网站2月7日刊登题为《200万年前,我们的人类祖先开始从水里捞鱼》的文章,作者是科迪·科蒂尔,内容编译如下:捕鱼可能是一种占许多国家蛋白质消费极大比例的全球性行为,但捕 美国加州理工学院喷气推进实验室的一个机器人专家团队,与卡内基梅隆大学机器人研究所科学家合作,开发出一种蛇形机器人,用于调查土星第六大卫星土卫二的地形,以寻找生命的“蛛丝马迹”。相关研究   AI芯片巨头低调赚钱  骆轶琪  在过去一年半导体行业下行周期中,除了英伟达以GPU霸主身份实现业绩快速成长之外,另一些主营虽非GPU,但是立足于AI定制芯片市场的半导体巨头也低调实现了稳健的成长性。  据Gartne 3月23日消息,vivo即将于3月26日发布vivo X Fold3系列折叠屏电话,其中包含vivo X Fold3和vivo X Fold3 Pro两款新品。据悉,vivo X Fold3采用了首发的碳纤维龙骨铰链,重量仅为219克,厚度为4.65毫米。相 。

本文链接:解锁AI的3D叙事 李飞飞、谷歌先行一步http://www.sushuapos.com/show-2-9614-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 南财数据周报(25期):央地协同推进数据流通治理,跨区域合作加速

下一篇: 今年,短剧要逆袭电影票房了?丨短剧帝国的微言大观⑮

热门资讯

  • 全国爱肝日丨专家提醒注意“小心肝”

    3月18日是第24个“全国爱肝日”。今年活动的主题是,“早防早筛,远离肝硬化”。重庆多所医院开展义诊咨询活动,通过普及肝病的防治知识,让民众主动筛查

  • 淋巴结冻干“锁鲜”技术或可用于肿瘤治疗

    人体免疫系统中的小过滤器淋巴结有了新妙用。近日,浙江大学药学院、金华研究院教授顾臻团队联合多位科研人员,在国际上首次提出利用冷冻干燥的淋巴结

  • 新AI系统可提供足球制胜战术

    未来的足球场,人工智能(AI)当“大脑”?《自然·通讯》19日发表一项来自谷歌深度思维的最新成果,研究团队报告了一个名为“TacticAI”的系统,能在足

  • 睡不够很焦虑?专家:警惕常见睡眠认知误区

    3月21日是世界睡眠日,今年中国主题为“健康睡眠 人人共享”。人的一生约有三分之一的时间是在睡眠中度过,睡眠、运动、营养被视为保障机体正常发育和

  • 突发!Kimi,崩了!

    因流量突然剧增,3月21日,陆续有用户在社交平台上表示,月之暗面旗下大模型应用Kimi智能助手的APP和小程序均无法正常使用。截至记者发稿时,相关

  • “认知选择”或影响人类语言演化

    人类的语言自产生以来,就不断演化发展。发音、词汇、语法的演变过程,是语言学家较为关注的领域。语言演化的根本动力是什么,演化又呈现出怎样的规律?我

  • 饭后想吃零食或因神经元过度活跃

    那些在吃完一顿饱饭后不久就在冰箱里翻找零食的人,可能不是胃口好,而是因为寻找食物的神经元过度活跃的缘故。美国加州大学洛杉矶分校心理学家在老鼠

  • 人工纳米流体突触可实现存内计算

    瑞士洛桑联邦理工学院工程学院研究团队制造了一种用于内存的新型纳米流体设备,这使他们第一次能连接两个“人工突触”。该设备为受大脑启发的液体硬

  • 首批量子测量领域国家标准发布

    随着量子技术的发展,利用量子特性突破传统测量技术极限的新一代精密测量技术——量子测量开始得到应用。记者从中国计量科学研究院获悉,由

  • 荣耀Magic6 RSR 保时捷设计首销卖光:9999元供不应求

    3月23日消息,荣耀Magic6 RSR 保时捷设计于3月22日正式开售,售价为9999元。该款电话首销当天即被抢购一空,荣耀商城显示,下一轮销售时间将是3月29日上午10:0

  • 电子导盲犬可能要来了!相关研究在我国取得新突破

    “啪嗒啪嗒......”一只机器狗在街上迈着规律的步伐,拉着牵引绳的盲人,在它的带领下越过沿路障碍,平稳地行走着,电子导盲犬能否取代传统导盲犬,解决视障

  • 中国民航颁发首个无人驾驶吨级电动垂直起降航空器型号合格证

    近日,民航华东地区管理局向峰飞科技公司颁发V2000CG无人驾驶航空器系统型号合格证,这也是中国民航系统颁发的首个无人驾驶吨级电动垂直起降航空器型

推荐资讯

  • 日榜
  • 周榜
  • 月榜