只需一段文字指令就能生成一段逼真视频,今年初,文生视频大模型Sora在全球人工智能业内外引发广泛关注。27日,2024中关村论坛年会上首次发布我国自研的具“长时长、高一致性、高动态性”特点的文生视频大模型Vidu。
记者从会上获悉,这一视频大模型由清华大学联合北京生数科技有限公司共同研发,可根据文本描述直接生成长达16秒、分辨率高达1080P的高清视频内容,不仅能模拟真实物理世界,还拥有丰富想象力。
清华大学人工智能研究院副院长、生数科技首席科学家朱军说,当前国内视频大模型的生成视频时长大多为4秒左右,Vidu则可实现一次性生成16秒的视频时长。同时,视频画面能保持连贯流畅,随着镜头移动,人物和场景在时间、空间中能保持高一致性。
在动态性方面,Vidu能生成复杂的动态镜头,不再局限于简单的推、拉、移等固定镜头,而是能在一段画面里实现远景、近景、中景、特写等不同镜头的切换,包括能直接生成长镜头、追焦、转场等效果。
“Vidu能模拟真实物理世界,生成细节复杂且符合物理规律的场景,例如合理的光影效果、细腻的人物表情等,还能创造出具有深度和复杂性的超现实主义内容。”朱军介绍,由于采用“一步到位”的生成方式,视频片段从头到尾连续生成,没有明显的插帧现象。
此外,Vidu还可生成如熊猫、龙等形象。
据悉,Vidu的技术突破源于团队在机器学习和多模态大模型方面的长期积累,其核心技术架构由团队早在2022年就提出并持续开展自主研发。“作为一款通用视觉模型,我们相信,Vidu未来能支持生成更加多样化、更长时长的视频内容,探索不同的生成任务,其灵活架构也将兼容更广泛的模态,进一步拓展多模态通用能力的边界。”朱军说。
(来源:新华社 记者:魏梦佳)
新快报讯 3月1日晚,由中国音乐家协会、广东省文学艺术界联合会、中共中山市委宣传部主办,广东省音乐家协会、中山市文学艺术界联合会承办的唱响“一带一路”放歌伶仃洋——中国音协“金钟之星”艺术团赴中山慰问演出在 乐山市中医医院,国家中医特色重点医院项目建设单位,是乐山市中医医、教、研中心,中西医并重,学科优势突出,影响力辐射省内外。新龙县,地处四川省甘孜藏族自治州腹地,基础医疗资源匮乏,医疗人才流失严 据新华社电 5日提请审议的政府工作报告提出,坚持以人民为中心的发展思想,履行好保基本、兜底线职责,采取更多惠民生、暖民心举措,扎实推进共同富裕,促进社会和谐稳定,不断增强人民群众的获得感、幸福感、安全感。 今年的政 为进一步促进中外人员往来,中方决定扩大免签国家范围,对瑞士、爱尔兰、匈牙利、奥地利、比利时、卢森堡6个国家持普通护照人员试行免签政策。2024年3月14日至11月30日期间,上述国家持普 近日,德国VEVA(韦瓦)公司在深圳投资8800万人民币,宣布设立技术中心,此举在净水器行业掀起不小的波澜。这一重大决策不仅彰显了韦瓦在净水技术领域的领先地位,也预示着其在全球市场的进一步扩张。作为 记者2024年3月7日从海关总署获悉,今年前2个月,我国货物贸易进出口规模创历史同期新高,外贸实现良好开局。 海关总署公布的数据显示,今年前2个月,我国货物贸易进出口总值6.61万亿元,同比增长8.7%;其中,出口3.75万亿元,增长10.3% 。本文链接:直接生成16秒高清视频 我国自研视频大模型在京发布http://www.sushuapos.com/show-1-11925-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。