直接生成16秒高清视频我国自研视频大模型在京发布

发布时间: 2024-04-28 08:53:17 来源：

观看：196

只需一段文字指令就能生成一段逼真视频，今年初，文生视频大模型Sora在全球人工智能业内外引发广泛关注。27日，2024中关村论坛年会上首次发布我国自研的具“长时长、高一致性、高动态性”特点的文生视频大模型Vidu。

记者从会上获悉，这一视频大模型由清华大学联合北京生数科技有限公司共同研发，可根据文本描述直接生成长达16秒、分辨率高达1080P的高清视频内容，不仅能模拟真实物理世界，还拥有丰富想象力。

清华大学人工智能研究院副院长、生数科技首席科学家朱军说，当前国内视频大模型的生成视频时长大多为4秒左右，Vidu则可实现一次性生成16秒的视频时长。同时，视频画面能保持连贯流畅，随着镜头移动，人物和场景在时间、空间中能保持高一致性。

在动态性方面，Vidu能生成复杂的动态镜头，不再局限于简单的推、拉、移等固定镜头，而是能在一段画面里实现远景、近景、中景、特写等不同镜头的切换，包括能直接生成长镜头、追焦、转场等效果。

“Vidu能模拟真实物理世界，生成细节复杂且符合物理规律的场景，例如合理的光影效果、细腻的人物表情等，还能创造出具有深度和复杂性的超现实主义内容。”朱军介绍，由于采用“一步到位”的生成方式，视频片段从头到尾连续生成，没有明显的插帧现象。

此外，Vidu还可生成如熊猫、龙等形象。

据悉，Vidu的技术突破源于团队在机器学习和多模态大模型方面的长期积累，其核心技术架构由团队早在2022年就提出并持续开展自主研发。“作为一款通用视觉模型，我们相信，Vidu未来能支持生成更加多样化、更长时长的视频内容，探索不同的生成任务，其灵活架构也将兼容更广泛的模态，进一步拓展多模态通用能力的边界。”朱军说。

（来源：新华社记者：魏梦佳）

21世纪经济报道记者钟雨欣郑雪北京报道民营经济已经成为推动我国发展不可或缺的力量，成为创业就业的主要领域、技术创新的重要主体、国家税收的重要来源，在我国经济发展中发挥着重美国在联合国大会上再次一票否决呼吁加沙停火的决议草案，这一举动再次引发了外界对美国在中东问题上的立场和偏袒以色列的质疑。巴勒斯坦常驻联合国观察员曼苏尔在会上发言时，手举因以军行动及围困而严重营养不良的加沙阴和俊科技部部长 2023年全国研发经费投入超过3.3万亿元，在量子技术、集成电路、人工智能、生物医药、新能源等领域取得一批重大原创成果，把对青年科技人才的培养作为一项长期的战略性工作……在5日举行的十四引言在现代配电系统的运营中，能效管理的重要性日益凸显。随着能源需求的增长和环境保护的压力，如何高效、简洁地管理配电系统成为了一个迫切需要解决的问题。在这样的背景下，“CS-Smartlink数字化配电 21世纪经济报道记者李莎北京报道 “三农”是关系国计民生的根本性问题，在今年政府工作报告重点部署的十项工作任务中，第七项即坚持不懈抓好“三农”工作，扎实推进乡村全面振兴。政府工新快报讯 3月6日，十四届全国人大二次会议新闻中心发布公告，广东代表团将于3月7日上午9时举行开放团组会议，审议政府工作报告，审查计划报告和草案、预算报告和草案，并在会后接受采访。。

本文链接：直接生成16秒高清视频我国自研视频大模型在京发布http://www.sushuapos.com/show-1-11925-0.html

声明：本网站为非营利性网站，本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：重庆九龙坡：打造“一刻钟便民生活圈”的城市范例

下一篇：南财早新闻｜规上工业企业利润连续三个季度增长；中国科幻产业总营收首破千亿元

直接生成16秒高清视频我国自研视频大模型在京发布

热门资讯

推荐资讯

快讯最热文章

直接生成16秒高清视频 我国自研视频大模型在京发布

热门资讯

推荐资讯

快讯最热文章

直接生成16秒高清视频我国自研视频大模型在京发布