中新经纬4月15日电 (常涛)用户在用AI工具生成图片尤其是视频时,普遍会遇到用文字难以描述的情况。
快手高级副总裁、社区科学线负责人盖坤15日在北京表示,AI在辅助创意表达上拥有巨大潜力,但当前的行业发展现状还远远无法满足用户需求,在AI生成内容的稳定性以及用户复杂创意的精确传达上仍有“很多挑战”。
“大家应该很自然地会感受到文字在表达影像信息时,是不完备的。我们需要有新的方式,能让人真正精准地表达出心中所想。”盖坤说。
当日,快手发布可灵AI全新2.0模型,包括可灵2.0视频生成模型及可图2.0图像生成模型。其中,在本次2.0模型的迭代中,可灵AI发布AI视频生成的全新交互理念Multi-modal Visual Language(MVL),让用户能够结合图像参考、视频片段等多模态信息,将脑海中包含身份、外观、风格、场景、动作、表情、运镜在内的多维度复杂创意,直接高效地传达给AI。
盖坤介绍,MVL由TXT(Pure Text,语义骨架)和MMW(Multi-modal-document as a Word,多模态描述子)组成,能从视频生成设定的基础方向以及精细控制这两个层面,精准实现AI创作者们的创意表达。
基于MVL理念,可灵AI推出多模态编辑功能。“用户可以在可灵AI的平台上体验多模态编辑能力。用户可以非常直接地把自己的想法用图像等方式作为输入,生成符合自己想法的创意视频。”盖坤介绍,MMW将不只局限于图片和视频,也可以引入其他模态的信息,例如声音、运动轨迹等,让用户实现更加丰富的表达。
快手副总裁、可灵AI负责人张迪介绍,当前,图生视频约占到可灵AI视频创作量的85%,图片质量也对视频的生成效果产生重要作用。
据快手方面介绍,截至目前,可灵AI全球用户规模已突破2200万,累计生成1.68亿个视频及3.44亿张图片素材。自2024年6月上线至今的10个月时间里,可灵AI已累计完成超20次迭代,月活用户数量增长25倍。
(更多报道线索,请联系本文作者常涛:changtao@chinanews.com.cn)(中新经纬APP)
中新经纬版权所有,未经书面授权,任何单位及个人不得转载、摘编或以其他方式使用。
责任编辑:魏薇 李中元
3月15日,我国一些地区停止居民集中供热。初春时节,乍暖还寒。停暖初期昼夜温差较大,老人、儿童等身体较弱者,可能需要使用电暖气、电热毯等取暖设备,这导致部分家庭近来用电量增加。最近,一款名为 3月21日上午,全球首列氢能源市域列车在中车长客股份公司(以下简称“中车长客”)试验线上进行了时速160公里满载运行试验。当日试验过程中,车以160公里/小时速度运行的列车,每公里实际运行平均能耗 3月24日,据央视财经消息,在今天开幕的中国发展高层论坛2024年年会现场,苹果公司首席执行官蒂姆·库克回应记者提问表示,苹果公司的Apple Vision Pro头显产品将在今年年内于中国市场上市, 3月22日,中国互联网络信息中心(CNNIC)发布第53次《中国互联网络发展状况统计报告》(以下简称《报告》)。《报告》显示,截至2023年12月,我国网民规模达10.92亿人,较2022年12月新增网民2480万人,互联网 记者3月22日获悉,中山大学、深圳华大生命科学研究院与复旦大学的研究团队合作,揭示了多种蚊虫在不同生境下病毒的多样性、传播分布的影响因素及地理谱系特征,在多维尺度上为研究蚊虫病毒组提供 近日,民航华东地区管理局向峰飞科技公司颁发V2000CG无人驾驶航空器系统型号合格证,这也是中国民航系统颁发的首个无人驾驶吨级电动垂直起降航空器型号合格证。航空器型号合格证取证是保障航空 。本文链接:AI生成视频用文字难以描述需求,如何破?http://www.sushuapos.com/show-2-12112-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。