设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

揭秘Sora:开发团队成立不到1年,核心成员含多位华人

发布时间: 来源:

  揭秘Sora:开发团队成立不到1年,核心成员包含多位华人aOH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

每经记者 文巧 aOH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  2月16日,OpenAI的AI视频模型Sora炸裂出道,生成的视频无论是清晰度、连贯性和时间上都令人惊叹,一时间,诸如“现实不存在了”的评论在全网刷屏。aOH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  Sora是如何实现如此颠覆性的能力的呢?这就不得不提到其背后的两项核心技术突破――Spacetime Patch(时空Patch)技术和Diffusion Transformer(DiT,或扩散型 Transformer)架构。aOH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  《每日经济新闻》记者查询这两项技术的原作论文发现,时空Patch的技术论文实际上是由谷歌DeepMind的科学家们于2023年7月发表的。DiT架构技术论文的一作则是Sora团队领导者之一William Peebles,但戏剧性的是,这篇论文曾在2023年的计算机视觉会议上因“缺少创新性”而遭到拒绝,仅仅1年之后,就成为Sora的核心理论之一。aOH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  如今,Sora团队毫无疑问已经成为世界上最受关注的技术团队之一。记者查询OpenAI官网发现,Sora团队由Peebles等3人领导,核心成员包括12人,其中有多位华人。值得注意的是,这支团队十分年轻,成立时间尚未超过1年。aOH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  创新“站在谷歌肩上”aOH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

   此前,OpenAI在X平台上展示了Sora将静态图像转换为动态视频的几个案例,其逼真程度令人惊叹。Sora是如何做到这一点的呢?这就不得不提到该AI视频模型背后的两项核心技术――DiT架构和Spacetime Patch(时空Patch)。aOH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  据外媒报道,Spacetime Patch是Sora创新的核心之一,该 项 技 术 是 建 立 在 谷 歌DeepMind对NaViT(原生分辨率视觉Transformer)和ViT(视觉Transformer)的早期研究基础上。aOH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  Patch可以理解为Sora的基本单元,就像GPT-4 的基本单元是Token。Token是文字的片段,Patch则是视频的片段。GPT-4被训练以处理一串Token,并预测出下一个Token。Sora遵循相同的逻辑,可以处理一系列的Patch,并预测出序列中的下一个Patch。aOH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  Sora之所以能实现突破,在于其通过Spacetime Patch将视频视为补丁序列,Sora保持了原始的宽高比和分辨率,类似于NaViT对图像的处理。这对于捕捉视觉数据的真正本质至关重要,使模型能够从更准确的表达中学习,从而赋予Sora近乎完美的准确性。由此,Sora能够有效地处理各种视觉数据,而无需调整大小或填充等预处理步骤。aOH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  记者注意到,OpenAI发布的Sora技术报告中透露了Sora的主要理论基础,其中Patch的技术论文名为Patch n' Pack: NaViT, a Vision Transformer for any Aspect Ratio and Resolution。记者查询预印本网站arxiv后发现,该篇论文是由谷歌DeepMind的科学家们于2023年7月发表的。aOH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  相关论文曾遭拒绝aOH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

   除此之外,Sora的另一个重大突破是其所使用的架构,传统的文本到视频模型(如Runway、Stable Diffusion)通常是扩散模型(Diffusion Model),文本模型例如GPT-4则是Transformer模型,而Sora则采用了DiT架构,融合了前述两者的特性。aOH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  据报道,传统的扩散模型的训练过程是通过多个步骤逐渐向图片增加噪点,直到图片变成完全无结构的噪点图片,然后在生成图片时,逐步减少噪点,直到还原出一张清晰的图片。Sora采用的架构是通过Transformer的编码器-解码器架构处理包含噪点的输入图像,并在每一步预测出更清晰的图像。DiT架构结合时空Patch,让Sora能够在更多的数据上进行训练,输出质量也得到大幅提高。aOH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  OpenAI发布的Sora技术报告透露,Sora采用的DiT架构是基于一篇名为Scalable diffusion models with transformers的学术论文。记者查询预印本网站arxiv后发现,该篇原作论文是2022年12月由伯克利大学研究人员William (Bill) Peebles和纽约大学的一位研究人员Saining Xie共同发表。William (Bill) Peebles之后加入了OpenAI,领导Sora技术团队。aOH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  然而,戏剧化的是,Meta的AI科学家Yann LeCun在X平台上透露,“这篇论文曾在2023年的计算机视觉会议(CVR2023)上因‘缺少创新性’而遭到拒绝,但在2023年国际计算机视觉会议(ICCV2023)上被接受发表,并且构成了Sora的基础。”aOH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  作为最懂DiT架构的人之一,在Sora发布后,Saining Xie在X平台上发表了关于Sora的一些猜想和技术解释,并表示,“Sora确实令人惊叹,它将彻底改变视频生成领域。”aOH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  “当Bill和我参与DiT项目时,我们并未专注于创新,而是将重点放在了两个方面:简洁性和可扩展性。”他写道:“简洁性代表着灵活性。关于标准的ViT,人们常忽视的一个亮点是,它让模型在处理输入数据时变得更加灵活。例如,在遮蔽自编码器(MAE)中,ViT帮助我们只处理可见的区块,忽略被遮蔽的部分。同样,Sora可以通过在适当大小的网格中排列随机初始化的区块来控制生成视频的尺寸。”aOH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  不过,他认为,关于Sora仍有两个关键点尚未被提及。一是关于训练数据的来源和构建,这意味着数据很可能是Sora成功的关键因素;二是关于(自回归的)长视频生成,Sora的一大突破是能够生成长视频,但OpenAI尚未揭示相关的技术细节。aOH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  开发团队还有“00后”aOH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

   随着Sora的爆火,Sora团队也来到世界舞台的中央,引发了持续的关注。记者查询OpenAI官网发现,Sora团队由William Peebles等3人领导,核心成员包括12人。从团队领导和成员的毕业和入职时间来看,这支团队成立的时间较短,尚未超过1年。aOH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  从年龄上来看,这支团队也非常年轻,两位研究负责人都是在2023年才刚刚博士毕业。William (Bill) Peebles于去年5月毕业,其与Saining Xie合著的扩散Transformer论文成为Sora的核心理论基础。Tim Brooks于去年1月毕业,是DALL-E 3的作者之一,曾在谷歌和英伟达就职。aOH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  团队成员中甚至还有“00后”。团队中的Will DePue生于2003年,2022年刚从密西根大学计算机系本科毕业,在今年1月加入Sora项目组。aOH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  此外,团队还有几位华人。据媒体报道,Li Jing是DALL-E 3的共同一作,2014年本科毕业于北京大学物理系,2019年获得MIT物理学博士学位,于2022年加入OpenAI。Ricky Wang则是今年1月刚刚从Meta跳槽到OpenAI。其余华人员工包括Yufei Guo等尚未有太多公开资料介绍。aOH速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  中新经纬1月12日电 “上海市消保委”微信号12日发布2023年投诉情况通报。其中提到“小程序”“短视频”夸大宣传问题突出等7方面问题。  据通报,2023年上海市消保委共处理消费者投诉422874件,同比上升36.68%,推进   今年春节假期琼州海峡客滚运输量较去年大幅增长  中新网广州2月19日电 (郭军 喻志专 赵卓)据交通运输部珠江航务管理局(简称“珠航局”)消息:2024年春节假期期间(2月10日至17日,正月初一至初八),琼州海峡省际客滚   中新经纬2月18日电 “长三角铁路”微博18日消息,截至2月17日,2024年春节假期正式落下帷幕,长三角铁路假期8天发送旅客逾1700万人次,日均发送旅客在215万人次以上,较2019年同期增幅超六成。2月18日(正月初九)是假期后的 美国国务卿布林肯近日在参加慕安会时说的一句话,可以被解读的空间很大,也值得深入解读一下。他在回答主持人关于“美中紧张局势正在导致更大的分裂”提问时引用了一句美国俚语,称在国际体系当中,“如 新华社记者付敏、姚雨璘在寸土寸金的厦门岛市区,面积约3公顷的骑马山片区保护区隐匿在林立的高楼大厦中。该保护区设置于2011年,是厦门五缘湾栗喉蜂虎市级自然保护区的重要组成部分——一种 新华社记者周义在福建省莆田市,“无忧电工”培训班的出现,为当地残障人士拓宽了就业渠道。“兼职电工,我的月收入平均增加1000多元。”通过培训获得电工证的第二批“无忧电工”梁志忠说话间难掩喜悦之情 。

本文链接:揭秘Sora:开发团队成立不到1年,核心成员含多位华人http://www.sushuapos.com/show-5-6758-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 创历史新高 民航春节假期运客1799.2万人次

下一篇: 中国内地中小企业投资AI技术意愿全球最强

热门资讯

推荐资讯

  • 安徽省市场监管局:宾馆酒店不得在订单生效后单方面毁约

    4月28消息,临近五一假期,安徽省市场监督管理局向全省各相关经营者和行业协会商会发布提醒告诫函,进一步规范节日期间旅游市场价格行为。提醒告诫函要求,各相关经营者要严格按照

  • 苏北首家voco酒店—海州湾voco酒店开业

    扬子晚报消息,近日,洲际酒店集团旗下品牌——voco酒店在连云区开门迎客。据悉,海州湾voco酒店是苏北的首家voco酒店,酒店位于东部城区CBD商务中心黄金地带,周边聚集了在海一方公

  • 妙峰山景区将于4月30日起重新开放

      4月29日,妙峰山景区宣布将于4月30日起重新开放,恢复正常票价售票。此外,国家级非遗妙峰山庙会定于5月7日至22日举行,为游客提供丰富的文旅体验,景区内的齐天乐茶苑仍处关闭状

  • 锦江酒店:2024第一季净利润1.9亿元,同比增加34.56%

    锦江酒店(600754.SH)发布2024年一季度报告,报告期内公司实现营业收入32.06亿元,同比增加6.77%;归属于上市公司股东的净利润1.9亿元,同比增加34.56%;归属于上市公司股东的扣除非经

  • 酒店分销技术商SiteMinder已接近收支平衡

    澳大利亚酒店分销与技术提供商SiteMinder公布2024财年第三季度财报,营收同比增长23.3%至4600万美元,主要得益于Demand Plus元搜索产品的强劲表现和用户基数的持续扩大。公司已

  • 这狐狸不是那狐狸

    在西方寓言谱系中,《乌鸦和狐狸》相当出名。它从早期的《伊索寓言》中脱颖而出,被后世作者基于不同价值取向而反复改写,并被收入各种文学启蒙读物中。

  • 马蜂窝五一大数据:亲子游热度大涨247%

      今年五一小长假,国内旅游市场延续火爆态势,各大知名旅游城市都仿佛来了“一亿人”。 马蜂窝大数据显示,一周以内的中短途旅行是大多数游客的选择,订单量占比超74%。自驾是家

  • 三亚金都蔚景温德姆酒店拍卖,起拍价5.25亿元

    5月7日,据阿里资产拍卖网显示,三亚市天涯区南边海路113-2号三亚南海方舟旅游度假酒店(又名金都蔚景温德姆酒)将于6月11日公开拍卖,起拍价5.25亿元,评估价5.84亿元。据了解,金都蔚景

  • 北京将在核心区旅游景区设限时落客区

      近日,北京市发展改革委公布《2024年北京市全面优化营商环境工作要点》,《要点》包括7大部分60项任务,计划年底前全部完成。  在提升公共文化和旅游服务水平上,今年将试点

  • 郑州发布重磅文旅文创奖励政策,最高可达500万元

      近日,郑州市文化广电和旅游局、郑州市财政局联合印发了《郑州市加快推进文旅文创高质量发展实施细则(试行)》。  细则显示:组织招徕来郑旅游的国内包机团队,游客上座率60

  • 万豪国际集团预计下月推出新品牌

    近日,在万豪第一季度财报电话会议上,万豪全球总裁柯诺安表示下月将推出新的全球品牌。他强调新的品牌将是一个“转换友好的全球品牌”,旨在满足日益增长的中档酒店市场需求,同时

  • 宏昆酒店集团五一假期业绩创新高

    5月8日,据中国日报消息,五一期间,宏昆酒店集团五一假期业绩创新高。数据显示,5月2日为酒店入住客流最高峰,单日酒店整体出租率95%,综合RevPAR近500元,单日满房门店20家,单日综合营收

  • 日榜
  • 周榜
  • 月榜