AI生成视频用文字难以描述需求，如何破？

发布时间: 2025-04-25 10:21:41 来源：

观看：143

　　中新经纬4月15日电 (常涛)用户在用AI工具生成图片尤其是视频时，普遍会遇到用文字难以描述的情况。

　　快手高级副总裁、社区科学线负责人盖坤15日在北京表示，AI在辅助创意表达上拥有巨大潜力，但当前的行业发展现状还远远无法满足用户需求，在AI生成内容的稳定性以及用户复杂创意的精确传达上仍有“很多挑战”。

　　“大家应该很自然地会感受到文字在表达影像信息时，是不完备的。我们需要有新的方式，能让人真正精准地表达出心中所想。”盖坤说。

　　当日，快手发布可灵AI全新2.0模型，包括可灵2.0视频生成模型及可图2.0图像生成模型。其中，在本次2.0模型的迭代中，可灵AI发布AI视频生成的全新交互理念Multi-modal Visual Language(MVL)，让用户能够结合图像参考、视频片段等多模态信息，将脑海中包含身份、外观、风格、场景、动作、表情、运镜在内的多维度复杂创意，直接高效地传达给AI。

　　盖坤介绍，MVL由TXT(Pure Text，语义骨架)和MMW(Multi-modal-document as a Word，多模态描述子)组成，能从视频生成设定的基础方向以及精细控制这两个层面，精准实现AI创作者们的创意表达。

　　基于MVL理念，可灵AI推出多模态编辑功能。“用户可以在可灵AI的平台上体验多模态编辑能力。用户可以非常直接地把自己的想法用图像等方式作为输入，生成符合自己想法的创意视频。”盖坤介绍，MMW将不只局限于图片和视频，也可以引入其他模态的信息，例如声音、运动轨迹等，让用户实现更加丰富的表达。

　　快手副总裁、可灵AI负责人张迪介绍，当前，图生视频约占到可灵AI视频创作量的85%，图片质量也对视频的生成效果产生重要作用。

　　据快手方面介绍，截至目前，可灵AI全球用户规模已突破2200万，累计生成1.68亿个视频及3.44亿张图片素材。自2024年6月上线至今的10个月时间里，可灵AI已累计完成超20次迭代，月活用户数量增长25倍。

　　(更多报道线索，请联系本文作者常涛：changtao@chinanews.com.cn)(中新经纬APP)

责任编辑：魏薇李中元

3月18日，记者从山西省人民政府获悉，“山西煤炭工业互联网智算平台”日前在山西联通大数据中心建设完成。该平台由中国联通与山西晋云互联科技有限公司共同打造，是山西省目前唯一的垂直行业类智 3月17日，记者从海南大学获悉，该校化学化工学院副教授李萌婷与相关研究团队合作，合成了多功能复合金纳米花颗粒。该颗粒配合温和光热、光动力、药物控释联合疗法，可有效促进感染性组织再生修复。记者3月21日从安徽农业大学获悉，该校生命科学学院韩毅教授课题组与国内外专家合作，发现了植物避盐性的关键基因。该研究对于提高植物耐盐性，帮助盐碱地下的农作物稳产具有重要理论指导意义。相　　“AI钢铁侠”黄仁勋，又进化了英伟达　　作者丨倪雨晴　　2024年，英伟达一年一度的GTC大会已然成为AI界春晚，现场座无虚席，全球AI爱好者翘首以待黄仁勋的独家SOLO。　　北京时间3月19日凌晨，GTC终于拉开大幕。英伟达创 3月22日消息，一加Ace 3V昨晚发布，起售价1999元，将于3月25日正式发售。现在这款新机已经来到我们评测室，下面为大家带来图赏。一加Ace 3V全球首发第三代骁龙7+移动平台，采用骁龙8 Gen3相同的4nm制程工 3月22日消息，数码闲聊站爆料称，xiaomi15 Pro将采用5000万像素的超大底三摄方案，其中一颗是全新的潜望长焦镜头。据资料显示，xiaomi11 Pro配备了潜望长焦镜头，而后续的12 Pro、13 Pro和14 Pro等机型则。

本文链接：AI生成视频用文字难以描述需求，如何破？http://www.sushuapos.com/show-2-12112-0.html

声明：本网站为非营利性网站，本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇： OpenAI被曝打造社交网络数据或将反哺AI模型训练

下一篇：营销巨头蓝色光标披露800万元数据资源存货，All in AI、营收同比增长15.5%

AI生成视频用文字难以描述需求，如何破？

热门资讯

推荐资讯

科技最热文章