设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

揭秘Sora:开发团队成立不到1年,核心成员含多位华人

发布时间: 来源:

  揭秘Sora:开发团队成立不到1年,核心成员包含多位华人HmR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

每经记者 文巧 HmR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  2月16日,OpenAI的AI视频模型Sora炸裂出道,生成的视频无论是清晰度、连贯性和时间上都令人惊叹,一时间,诸如“现实不存在了”的评论在全网刷屏。HmR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  Sora是如何实现如此颠覆性的能力的呢?这就不得不提到其背后的两项核心技术突破――Spacetime Patch(时空Patch)技术和Diffusion Transformer(DiT,或扩散型 Transformer)架构。HmR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  《每日经济新闻》记者查询这两项技术的原作论文发现,时空Patch的技术论文实际上是由谷歌DeepMind的科学家们于2023年7月发表的。DiT架构技术论文的一作则是Sora团队领导者之一William Peebles,但戏剧性的是,这篇论文曾在2023年的计算机视觉会议上因“缺少创新性”而遭到拒绝,仅仅1年之后,就成为Sora的核心理论之一。HmR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  如今,Sora团队毫无疑问已经成为世界上最受关注的技术团队之一。记者查询OpenAI官网发现,Sora团队由Peebles等3人领导,核心成员包括12人,其中有多位华人。值得注意的是,这支团队十分年轻,成立时间尚未超过1年。HmR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  创新“站在谷歌肩上”HmR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

   此前,OpenAI在X平台上展示了Sora将静态图像转换为动态视频的几个案例,其逼真程度令人惊叹。Sora是如何做到这一点的呢?这就不得不提到该AI视频模型背后的两项核心技术――DiT架构和Spacetime Patch(时空Patch)。HmR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  据外媒报道,Spacetime Patch是Sora创新的核心之一,该 项 技 术 是 建 立 在 谷 歌DeepMind对NaViT(原生分辨率视觉Transformer)和ViT(视觉Transformer)的早期研究基础上。HmR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  Patch可以理解为Sora的基本单元,就像GPT-4 的基本单元是Token。Token是文字的片段,Patch则是视频的片段。GPT-4被训练以处理一串Token,并预测出下一个Token。Sora遵循相同的逻辑,可以处理一系列的Patch,并预测出序列中的下一个Patch。HmR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  Sora之所以能实现突破,在于其通过Spacetime Patch将视频视为补丁序列,Sora保持了原始的宽高比和分辨率,类似于NaViT对图像的处理。这对于捕捉视觉数据的真正本质至关重要,使模型能够从更准确的表达中学习,从而赋予Sora近乎完美的准确性。由此,Sora能够有效地处理各种视觉数据,而无需调整大小或填充等预处理步骤。HmR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  记者注意到,OpenAI发布的Sora技术报告中透露了Sora的主要理论基础,其中Patch的技术论文名为Patch n' Pack: NaViT, a Vision Transformer for any Aspect Ratio and Resolution。记者查询预印本网站arxiv后发现,该篇论文是由谷歌DeepMind的科学家们于2023年7月发表的。HmR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  相关论文曾遭拒绝HmR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

   除此之外,Sora的另一个重大突破是其所使用的架构,传统的文本到视频模型(如Runway、Stable Diffusion)通常是扩散模型(Diffusion Model),文本模型例如GPT-4则是Transformer模型,而Sora则采用了DiT架构,融合了前述两者的特性。HmR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  据报道,传统的扩散模型的训练过程是通过多个步骤逐渐向图片增加噪点,直到图片变成完全无结构的噪点图片,然后在生成图片时,逐步减少噪点,直到还原出一张清晰的图片。Sora采用的架构是通过Transformer的编码器-解码器架构处理包含噪点的输入图像,并在每一步预测出更清晰的图像。DiT架构结合时空Patch,让Sora能够在更多的数据上进行训练,输出质量也得到大幅提高。HmR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  OpenAI发布的Sora技术报告透露,Sora采用的DiT架构是基于一篇名为Scalable diffusion models with transformers的学术论文。记者查询预印本网站arxiv后发现,该篇原作论文是2022年12月由伯克利大学研究人员William (Bill) Peebles和纽约大学的一位研究人员Saining Xie共同发表。William (Bill) Peebles之后加入了OpenAI,领导Sora技术团队。HmR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  然而,戏剧化的是,Meta的AI科学家Yann LeCun在X平台上透露,“这篇论文曾在2023年的计算机视觉会议(CVR2023)上因‘缺少创新性’而遭到拒绝,但在2023年国际计算机视觉会议(ICCV2023)上被接受发表,并且构成了Sora的基础。”HmR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  作为最懂DiT架构的人之一,在Sora发布后,Saining Xie在X平台上发表了关于Sora的一些猜想和技术解释,并表示,“Sora确实令人惊叹,它将彻底改变视频生成领域。”HmR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  “当Bill和我参与DiT项目时,我们并未专注于创新,而是将重点放在了两个方面:简洁性和可扩展性。”他写道:“简洁性代表着灵活性。关于标准的ViT,人们常忽视的一个亮点是,它让模型在处理输入数据时变得更加灵活。例如,在遮蔽自编码器(MAE)中,ViT帮助我们只处理可见的区块,忽略被遮蔽的部分。同样,Sora可以通过在适当大小的网格中排列随机初始化的区块来控制生成视频的尺寸。”HmR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  不过,他认为,关于Sora仍有两个关键点尚未被提及。一是关于训练数据的来源和构建,这意味着数据很可能是Sora成功的关键因素;二是关于(自回归的)长视频生成,Sora的一大突破是能够生成长视频,但OpenAI尚未揭示相关的技术细节。HmR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  开发团队还有“00后”HmR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

   随着Sora的爆火,Sora团队也来到世界舞台的中央,引发了持续的关注。记者查询OpenAI官网发现,Sora团队由William Peebles等3人领导,核心成员包括12人。从团队领导和成员的毕业和入职时间来看,这支团队成立的时间较短,尚未超过1年。HmR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  从年龄上来看,这支团队也非常年轻,两位研究负责人都是在2023年才刚刚博士毕业。William (Bill) Peebles于去年5月毕业,其与Saining Xie合著的扩散Transformer论文成为Sora的核心理论基础。Tim Brooks于去年1月毕业,是DALL-E 3的作者之一,曾在谷歌和英伟达就职。HmR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  团队成员中甚至还有“00后”。团队中的Will DePue生于2003年,2022年刚从密西根大学计算机系本科毕业,在今年1月加入Sora项目组。HmR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  此外,团队还有几位华人。据媒体报道,Li Jing是DALL-E 3的共同一作,2014年本科毕业于北京大学物理系,2019年获得MIT物理学博士学位,于2022年加入OpenAI。Ricky Wang则是今年1月刚刚从Meta跳槽到OpenAI。其余华人员工包括Yufei Guo等尚未有太多公开资料介绍。HmR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  网红自热火锅为何变冷了?  不插电、不用火,就能吃上热腾腾的小火锅。  作为一种便捷、快速的食品,自热火锅曾受到不少消费者的追捧,这背后是快节奏生活中,“懒人”群体和宅经济的逐步兴起,让自热火锅一度成为一个新   下班后涌入医院做推拿;常年服用多种保健品;关注艾灸、刮痧、八段锦等调理攻略  “脆皮年轻人”花式养生,有人月均账单超千元  中医专家提醒,应审慎评价身体状况,切勿盲目跟风  本报记者 王羡茹 曲欣悦  阅读提 今天《中国电子报》刊登西北工业大学校长、中国工程院院士宋保维署名文章《发挥教育科技人才优势 为建设制造强国贡献高校力量》现将文章登载如下,以飨读者。制造业是国家经济命脉所系,是立国之本、   中新经纬2月23日电 (刘雪玉)论坛上聊Sora,吃饭聊Sora,甚至走路也在聊Sora……亚布力论坛上,与会企业家们的高密度讨论,再度印证Sora的火爆。  “横空出世”的Sora到底有多大的冲击力,这项技术对未来有怎样的意义?参会   广西南宁新能源全产业链加快成型  中新网南宁2月22日电 (黄令妍 韦雅丹)广西南宁市工信局党组书记、局长卢晴22日介绍,当地新能源全产业链加快成型,比亚迪、多氟多等一批重大项目投产,龙电华鑫、宸宇富基等项目落 。

本文链接:揭秘Sora:开发团队成立不到1年,核心成员含多位华人http://www.sushuapos.com/show-5-6758-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 创历史新高 民航春节假期运客1799.2万人次

下一篇: 中国内地中小企业投资AI技术意愿全球最强

热门资讯

推荐资讯

  • 韩国乐天集团决定出售沈阳乐天城项目

      近日,据业界消息,乐天集团决定将中途停建的沈阳“乐天城”项目出售给沈阳市皇姑区一国企。这距离该项目因“萨德”矛盾被中断已过8年。据消息,乐天集团已与沈阳皇姑诚信发

  • 千味央厨:2023年实现营收19.01亿元,同比增长27.69%

    4月28日,千味央厨披露2023年年度报告。2023年,公司实现营业收入19.01亿元,同比增长27.69%;归母净利润为1.34亿元,同比增长31.43%。其中2023年因股权激励产生的费用为1791.08万元,

  • 四川多个景区官宣免门票优惠政策

      “五一”假期即将到来。近期,四川多个景区官宣了“劳模”免票政策.    九寨沟景区  2024年5月1日至5月5日,对持有地市州及以上人民政府颁发的“劳动模范”证书、政

  • 我们一起上春山

    人间美景四月天,草色青漫水如蓝。春日登山成了很多人迎接春天又锻炼体魄的最佳选择之一。有的人边走边吃,悠闲赏春花;有的人手脚并用,勇攀高峰成就满怀

  • 文旅部:2024年一季度国内出游人次超14亿

      4月30日,文旅部发布消息,2024年一季度,国内出游人次14.19亿,比上年同期增加2.03亿,同比增长16.7%。其中,城镇居民国内出游人次10.77亿,同比增长14.1%;农村居民国内出游人次3.42

  • 天津首个配售型保障性住房项目开工

      近日,从天津市住建委获悉,天津市首个配售型保障性住房项目——红桥区丽水苑项目开工,标志着天津市配售型保障性住房建设迈出新步伐。  该项目位于天津市红桥区光荣道与咸

  • 广东佛山首家君亭酒店正式开业

    近日,广东佛山千灯湖君亭酒店启幕。该项目不仅是君亭品牌在佛山的首秀,也是上海君达城与中保产业基金在酒店资产管理业务项下的首个合作项目。酒店位于千灯湖板块核心区位,紧邻

  • 一街一巷续写静水流深

    弥漫着烟火气与人情味的丽水松阳明清古街、以老台门闻名的嵊州崇仁古镇、将“一剑一瓷”传承至今的龙泉西街历史文化街区……一砖一瓦

  • 五一GO!丨“五一”假期首日 全国铁路发送旅客逾2000万人次

    21世纪经济报道记者 高江虹 北京报道“五一”假期首日,国内铁路、民航迎来客流高峰,各大景区进入“人海模式”。中国国家铁路集团有限公司(下

  • 澳门“五一”假期入境旅客逾60万人次,酒店入住率近九成

    5月7日,据央视新闻客户端消息,澳门特区政府旅游局6日公布的初步统计数据显示,今年“五一”假期澳门的旅游市场客流畅旺。5月1日至5日,入境澳门的总旅客量约60.5万人次,与去年日均

  • 锦江酒店(中国区)成立度假公寓事业部、中高端业务部

    近日,在锦江酒店(中国区)的2024年度会议上,锦江酒店(中国区)CEO王伟首次公布公司全新品牌战略。此轮品牌架构优化中,还特别成立了独立的度假公寓事业部,形成以覆盖不同细分市场的暻

  • 《春色寄情人》导演程亮:爱情不是爱情剧的唯一密码

    “生命晨起暮落,爱意不期而遇。”一个是性格桀骜但身心孤独的遗体整容师,一个是身体虽有缺陷但勇敢耀眼的金牌销售。他们原本在各自的世界里前行:一个

  • 日榜
  • 周榜
  • 月榜