设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

Sora三巨头首次解密幕后信息,CTO:最快年内开放

2024-03-26 17:06:44 来源: 量子位

“Sora是世界建模的第一步”tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“Sora最快今年内开放公测。”tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在一场访谈中,OpenAI CTO Mira Murati亲自透露了这一消息。tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Sora三巨头首次解密幕后信息,CTO:最快年内开放

短短10分钟里,Sora技术细节、进展、规划等当下最热议的问题,都有了更进一步解答:tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  • 生成20秒的720P视频只需几分钟
  • 计算资源远超ChatGPT和DALL·E
  • 目前正在进行正在进行红队测试
  • 未来版本有望支持视频声效

而且还向外界传递了一层重要信息:tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

加上前几天,Sora的三名研发主管——Tim Brooks、William Peebles和Aditya Ramesh,也参与了一场16分钟的播客访谈。tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

综合两场对话,关于Sora背后的秘密,也有了更多蛛丝马迹可以探寻。tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Sora背后还有多少秘密?

关于Sora,人们最关心也最期待的,可能就是什么时候才能上手体验了。tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

对此,Mira表示Sora正在进行红队测试,以确保工具的安全性,并且不会产生偏见或其他有害问题。tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

对于具体的时间,Mira也立下了flag——今年年内让Sora与广大用户正式见面。tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

此外,两场对话中谈到的其他话题,可以分为技术细节、项目规划和未来展望三个部分。tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

揭开更多技术细节

技术方面,三人团队表示,Sora更像是介于Dall·E这类扩散模型和GPT之间。tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

训练数据是不方便说滴(doge),大致就是公开数据和OpenAI已获授权的数据。tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不过他们专门cue了一个点:通常图像、视频模型都是在一个固定尺寸上进行训练,而Sora使用了不同时长、比例和清晰度的视频。tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

具体方法之前的技术报告已经有了说明,就是用“Patches”来统一不同的视觉数据表现形式。tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

然后可以根据输入视频的大小,训练模型认识不同数量的小块。通过这种方式,模型能够更加灵活学习各种数据,同时也能生成不同分辨率和尺寸的内容。tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Sora三巨头首次解密幕后信息,CTO:最快年内开放

性能方面,Mira和三人组的说法则略有不同:tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

三人组透露,有一次给Sora布置好任务后,出去买了杯咖啡,结果回来之后视频还没做好。tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而Mira这边的回答则是,Sora生成720P分辨率、长达20秒的视频内容,只需要几分钟就能完成。tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

当然,具体消耗的时间,还要取决于任务复杂程度等多种因素,不能简单一概而论。tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不过Mira这边表示,在正式发布之前将继续努力优化算法,以降低所需的算力。tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这些问题还需解决

而针对Sora存在的不足,他们的回答也很坦诚,表示其还存在无法完美处理手部的生成,渲染复杂的物理过程也存在一定难度等一系列问题。tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

除了这些bug型的缺陷之外,Sora不能给视频添加声音也算一个美中不足之处,对此三人组给出了这样的回应:tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而Mira对此的回答则更像是给人们吃了一颗定心丸——未来版本有望支持视频声效,增强用户体验。tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而除了这些产品本身的问题之外,为Sora生成的视频加入溯源信息,以防出现造假,也是OpenAI当下的一项重要任务。tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

同时,负责人和Mira都表示,团队始终在收集来自各界的用户反馈,三人组还举例说有用户希望能加入提示词以外,更精细、直接的控制方式,团队将此作为了重点考虑的一个方向。tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Sora,未来可期

最后,针对Sora的未来,负责人给出了很高的预期,并表示其将不仅仅在视频创作方面发挥作用。tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

因此,负责人对Sora及未来可能在其基础上开发的其他AI模型充满了期待——通过学习视觉信息的方式理解这个世界,在未来能够更好地帮助人类。tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

对此有网友表示,这的确是个好消息,Sora的意义不仅在于其本身,而且还会对其他AI产生影响。tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

另一边,已经有人在期待Runway等前任王者对此的反应了。tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Sora三巨头首次解密幕后信息,CTO:最快年内开放

不过,虽然团队自己说Sora在未来能够理解人类世界,但它到底能不能真的算世界模型,还存在不小的争议。tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Sora是世界模型吗?

针对这个问题,正反双方各执一词,支持者的主要理由,是认为从Sora生成的视频中能看出其对物理世界的理解。tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而反方则不认同Sora是世界模型,代表人物是图灵奖得主、Meta首席AI科学家LeCun。tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

近期,LeCun点赞了一篇澳大利亚学者的万字长文,文章的核心观点就是认为Sora不是世界模型。tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Sora三巨头首次解密幕后信息,CTO:最快年内开放

其中最核心的原因,是Sora并没有物理引擎来运行前向时间模拟,而且训练过程是端到端完成的,数据中并没有物理规律信息。tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

即便是抛开训练和生成过程,单从表现上看,Sora的输出也出现了违反重力、碰撞动力学等物理规律的情况。tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Sora三巨头首次解密幕后信息,CTO:最快年内开放tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

△Sora生成的“反重力玻璃杯”tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

所以,作者认为,将Sora称为世界模型是缺少充分依据的。tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而人们比较关心的另一个问题,是Sora的训练过程,是否使用了虚幻引擎(Unreal Engine)5。tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不过作者也没有给出确切结论,只表示这只是猜测,目前并没有确切的证据表明Sora确实使用了UE5进行训练。tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Sora三巨头首次解密幕后信息,CTO:最快年内开放

而要想进一步揭开这些问题,或许要OpenAI再次自己出来公布,或者直接开源了。tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

One More Thing

虽然两场访谈的确透露出了不少干货,但针对人们同样广为关心的训练数据来源问题,无论是三人团队还是Mira,说法都十分模糊——tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Sora的训练过程中使用的是公开可用和已获得授权的数据源。tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

但对于YouTube、Instagram和Facebook上的视频是否被用作训练数据,Mira则是顾左右而言他:tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Sora三巨头首次解密幕后信息,CTO:最快年内开放

不过,这个说法的可信度先放下不谈,即便真的如Mira所说,也有网友并不认账:tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Sora三巨头首次解密幕后信息,CTO:最快年内开放

参考链接:
[1]https://www.youtube.com/watch?v=Srh1lut4Q2A(第53分钟开始)tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
[2]https://www.youtube.com/watch?v=mAUpxN-EIgUtRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
[3]https://artificialcognition.net/posts/video-generation-world-simulators/tRH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本文链接:Sora三巨头首次解密幕后信息,CTO:最快年内开放http://www.sushuapos.com/show-2-4230-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 通用图大模型HiGPT:一己之力建模任何图结构关系!来自港大数据智能实验室&百度

下一篇: 一年暴涨900%,这个华人成为黄院士门下最大赢家

热门资讯

  • 全国首个模拟验证机场开工

    记者日前获悉,位于四川成都未来科技城应用性科创区的民航科技创新示范区(B区)航站楼项目,近日取得施工许可证。这也意味着全国首个模拟验证机场开工。

  • 睡不够很焦虑?专家:警惕常见睡眠认知误区

    3月21日是世界睡眠日,今年中国主题为“健康睡眠 人人共享”。人的一生约有三分之一的时间是在睡眠中度过,睡眠、运动、营养被视为保障机体正常发育和

  • 我国科学家揭示东北黑土成因

    记者3月20日从中国科学院地质与地球物理研究所获悉,该所科研人员在东北黑土区开展了大范围的野外调查和样品采集工作,通过分析采集的黑土样品发现,黑

  • 自主研制!哈工大“天都二号”探月卫星成功发射

    科技日报从哈尔滨工业大学获悉,北京时间2024年3月20日8时31分28秒,“天都一号”“天都二号”通导技术试验星伴随探月工程四期鹊桥二号中继星任务搭乘

  • CRISPR能消除培养细胞中艾滋病病毒

    荷兰阿姆斯特丹大学医学院科学家开展的一项新研究证明,利用最新CRISPR-Cas基因编辑技术,能消除实验室中受感染细胞内所有艾滋病病毒(HIV)的痕迹,为治愈

  • 甘肃首座特高压换流站迎来“新成员”

    3月18日,伴随着搬运车的轰鸣声,全国首个大规模清洁能源特高压直流输电工程的送端±800千伏特高压祁连换流站迎来了一位“新成员”—&mdas

  • 数据要素叩开资本市场大门,南财统计各地“数据资产入表”现状,谁是积极入局者?

    南方财经全媒体记者马嘉璐 研究员仇雯 广州报道凭借一纸证书,就能获批100万、500万、甚至千万元贷款……数据要素链接金融市场开辟的新财

  • 光储行业迎来2000V新时代

    3月21日,由安徽省工业和信息化厅指导、中国光伏行业协会主办、阳光电源股份有限公司承办的“PAT2024爱光伏一生一世”先进技术研讨会在合肥举办。光

  • 首发第三代骁龙7+!一加Ace 3V图赏

    3月22日消息,一加Ace 3V昨晚发布,起售价1999元,将于3月25日正式发售。现在这款新机已经来到我们评测室,下面为大家带来图赏。一加Ace 3V全球首发第三代骁龙

  • 首批量子测量领域国家标准发布

    随着量子技术的发展,利用量子特性突破传统测量技术极限的新一代精密测量技术——量子测量开始得到应用。记者从中国计量科学研究院获悉,由

  • 吸烟会增加腹部脂肪

    科学杂志《成瘾》3月21日发表的一项新研究显示,刚开始吸烟和终生吸烟都可能增加腹部脂肪,特别是内脏脂肪。内脏脂肪与心脏病、糖尿病、中风和痴呆症

  • “穿上就走”的通用外骨骼面世

    美国佐治亚理工学院机械工程师开发了一种控制机器人外骨骼的通用方法。无需专门训练、特别校准,对复杂算法进行调整后,用户穿上外骨骼就可以直接行走

推荐资讯

  • 日榜
  • 周榜
  • 月榜