MiniMax紧盯底层模型加速迭代

发布时间: 2025-02-21 09:20:13 来源：千龙网

观看：133

用人工智能生成视频，是许多人乐于尝试的应用。但AI的技术缺陷也引来很多吐槽：“上一段视频中生成的是张三，下一段视频就变成了另一张脸。无论怎么调整，都无法让两段视频的主角变成同一人。”人物角色一致性的难题，让AI难以制作出同一人物角色、不同故事情节的短片，大大限制了AI生成视频的应用场景。

2025年1月，稀宇科技（MiniMax）发布的最新视频模型化解了这一难题。用户只需提供1张人物的正面照片，不论生成多少段风格迥异的视频，主角都是这个人。这让网友惊呼，一张照片就能做电影，这不是梦！

在创业过程中，MiniMax始终坚持技术驱动。动态视频中如何保持人物面部多角度的真实度和稳定性，如何保持人物角色高度一致……开发团队进行了大量技术探索，比选不同的技术路径，最后开发出S2V模型——只需传统方案1%的输入量和计算成本，“上传1张图片”的效果就足够好。在3年多时间里，一次次迭代升级，文生视频、图生视频、主体参考等功能持续优化。这些创新，让海螺AI视频在激烈竞争中杀出重围，用户分布在全球超200个国家和地区。

在文生语音等功能上，MiniMax也走出了差异化路线。网友发现，MiniMax的语音功能竟然带有情绪调节和效果器功能，AI生成的语音可以带上开心、难过、生气等情绪，这一创新让有声书和广播剧的生产力大幅提升。“通用人工智能不是简单的互联网流量变化，而是计算范式的颠覆式创新，将会引领生产力、社会分工以及产业结构的深刻变革。”MiniMax创始人闫俊杰说。

算力、算法和数据是人工智能发展的“铁三角”。MiniMax创立之初，算力和数据十分有限，唯一选择就是在算法上求突破。从2023年夏天开始，公司将80%的算力与研发资源投入底层架构研发，这在外人看来就像一场豪赌。“我们在工程上遇到的很多问题，源于一片漆黑的未知。”公司技术团队在没有成熟经验可供借鉴的情况下，一次次试错，持续进行摸索。一年后，公司成功推出基于MoE架构的模型。今年1月，大规模实现线性注意力机制的MiniMax-01模型诞生，并逐渐为行业广泛认可。

“底层模型能力是决定大模型应用成功与否的首要因素。”MiniMax副总裁刘华告诉记者，虽然照着现成的图纸盖楼相对容易，但图纸的不足也会限制楼房的高度。我们选择用自己的图纸构筑大厦，一开始或许慢一些，但希望能更好应对未来的挑战。底层架构如同AI“新基建”，MiniMax-01模型突破了长文本处理瓶颈，可高效处理最长400万token（词元）的上下文。在工业领域，该模型可以快速解析百万字设备日志，辅助故障诊断；在医疗场景，它可连续跟踪患者数年病历，生成个性化治疗方案。最近两年，大模型技术快速迭代，国际国内AI行业都在白热化竞争。底层模型一次重大迭代对产品带来的优化效果，会远超在工程实现层面对产品进行“雕花”。这也是MiniMax始终紧盯模型本身，加速迭代升级的重要原因。

作为上海人工智能高地孵化的代表性企业，MiniMax的成长离不开这座城市独特的文化和基因。上海汇聚了全球顶尖的AI人才，大量富有热情的年轻人才，为产业快速发展提供了支撑。在MiniMax上海总部大楼，研发人员持续增多。不久前，上海推出人工智能“模塑申城”实施方案，在算力、场景、数据、人才方面推出一批有力举措。上海还积极推动大模型企业与场景企业对接。以MiniMax为例，他们与小红书合作打造生成式智能搜索，与阅文集团合作将数千本小说变成超自然、高保真的有声书等，通过相互赋能实现更快发展。闫俊杰相信，“真正有价值的事，不是当前做得怎么样，而是技术进化的速度。”

用人工智能生成视频，是许多人乐于尝试的应用。但AI的技术缺陷也引来很多吐槽：“上一段视频中生成的是张三，下一段视频就变成了另一张脸。无论怎么调整，都无法让两段视频的主角变成同一人。”人物角色一致性的难题，让AI难以制作出同一人物角色、不同故事情节的短片，大大限制了AI生成视频的应用场景。

2025年1月，稀宇科技（MiniMax）发布的最新视频模型化解了这一难题。用户只需提供1张人物的正面照片，不论生成多少段风格迥异的视频，主角都是这个人。这让网友惊呼，一张照片就能做电影，这不是梦！

在创业过程中，MiniMax始终坚持技术驱动。动态视频中如何保持人物面部多角度的真实度和稳定性，如何保持人物角色高度一致……开发团队进行了大量技术探索，比选不同的技术路径，最后开发出S2V模型——只需传统方案1%的输入量和计算成本，“上传1张图片”的效果就足够好。在3年多时间里，一次次迭代升级，文生视频、图生视频、主体参考等功能持续优化。这些创新，让海螺AI视频在激烈竞争中杀出重围，用户分布在全球超200个国家和地区。

在文生语音等功能上，MiniMax也走出了差异化路线。网友发现，MiniMax的语音功能竟然带有情绪调节和效果器功能，AI生成的语音可以带上开心、难过、生气等情绪，这一创新让有声书和广播剧的生产力大幅提升。“通用人工智能不是简单的互联网流量变化，而是计算范式的颠覆式创新，将会引领生产力、社会分工以及产业结构的深刻变革。”MiniMax创始人闫俊杰说。

算力、算法和数据是人工智能发展的“铁三角”。MiniMax创立之初，算力和数据十分有限，唯一选择就是在算法上求突破。从2023年夏天开始，公司将80%的算力与研发资源投入底层架构研发，这在外人看来就像一场豪赌。“我们在工程上遇到的很多问题，源于一片漆黑的未知。”公司技术团队在没有成熟经验可供借鉴的情况下，一次次试错，持续进行摸索。一年后，公司成功推出基于MoE架构的模型。今年1月，大规模实现线性注意力机制的MiniMax-01模型诞生，并逐渐为行业广泛认可。

“底层模型能力是决定大模型应用成功与否的首要因素。”MiniMax副总裁刘华告诉记者，虽然照着现成的图纸盖楼相对容易，但图纸的不足也会限制楼房的高度。我们选择用自己的图纸构筑大厦，一开始或许慢一些，但希望能更好应对未来的挑战。底层架构如同AI“新基建”，MiniMax-01模型突破了长文本处理瓶颈，可高效处理最长400万token（词元）的上下文。在工业领域，该模型可以快速解析百万字设备日志，辅助故障诊断；在医疗场景，它可连续跟踪患者数年病历，生成个性化治疗方案。最近两年，大模型技术快速迭代，国际国内AI行业都在白热化竞争。底层模型一次重大迭代对产品带来的优化效果，会远超在工程实现层面对产品进行“雕花”。这也是MiniMax始终紧盯模型本身，加速迭代升级的重要原因。

作为上海人工智能高地孵化的代表性企业，MiniMax的成长离不开这座城市独特的文化和基因。上海汇聚了全球顶尖的AI人才，大量富有热情的年轻人才，为产业快速发展提供了支撑。在MiniMax上海总部大楼，研发人员持续增多。不久前，上海推出人工智能“模塑申城”实施方案，在算力、场景、数据、人才方面推出一批有力举措。上海还积极推动大模型企业与场景企业对接。以MiniMax为例，他们与小红书合作打造生成式智能搜索，与阅文集团合作将数千本小说变成超自然、高保真的有声书等，通过相互赋能实现更快发展。闫俊杰相信，“真正有价值的事，不是当前做得怎么样，而是技术进化的速度。”

据法新社巴黎3月15日报道，15日发布的一项新的重要分析称，影响神经系统的疾病——如中风、偏头痛和痴呆症——已经超过心脏病，成为全球范围内导致人们健康损害的主要原因。据英国《泰晤士报》网站3月15日报道，2020年1月，英国帝国理工学院的亚当·汉普希尔与英国广播公司合作，对8万人进行了30分钟的测试，目的是揭示生活方式的改变会影响我们的大脑功能。三个月眼眸深邃似海、璨如星河，中国医学科学院生物医学工程研究所眼科诊疗技术研发团队（以下简称“团队”）正是眼眸“侦探”。该团队不久前被授予“国家卓越工程师团队”称号。别看人眼只有8克左右，却近年来，电动自行车以便利性受到大众青睐，但相关起火事故威胁着居民的生命财产安全。据国家消防救援局发布的统计数据，2023年全国共接报电动自行车火灾2.1万起，比2022年增加17.4%。电动自行车起火 21世纪经济报道记者孔海丽、实习生邓熙涵北京报道“民以食为天，食与民同欢”，吃得健康、吃得安全是消费者长期以来的普遍共识。当代消费者已不止于填饱肚子，而是讲求“精耕细作”。消随着量子技术的发展，利用量子特性突破传统测量技术极限的新一代精密测量技术——量子测量开始得到应用。记者从中国计量科学研究院获悉，由该院牵头编制的《量子测量术语》《量子精密。

本文链接：MiniMax紧盯底层模型加速迭代http://www.sushuapos.com/show-2-10792-0.html

声明：本网站为非营利性网站，本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇： AI时代仍需一锤一凿的“笨功夫”

下一篇：我国首套航空大地电磁探测系统完成5000米高寒高海拔地质勘查任务

MiniMax紧盯底层模型加速迭代

热门资讯

推荐资讯

科技最热文章