MiniMax发布全模态模型“全家桶”

发布时间: 2025-11-01 11:49:04 来源：中国科学报

观看：164

10月最后一周，人工智能“独角兽”上海稀宇极智科技有限公司（即MiniMax）掀起了一场AI技术的“全家桶”发布热潮。继开源文本大模型M2之后，MiniMax接连发布视频模型Hailuo 2.3、语音模型Speech 2.6和音乐模型Music 2.0。

10月27日，MiniMax新一代文本大模型MiniMax-M2宣布发布和开源，这款仅有10B激活参数（总参230B）的轻量级模型在全球权威测评榜单Artificial Analysis (AA)上总分冲入全球前五、开源第一，跻身文本模型第一梯队。

在模型定价方面，该模型“高智能，更实惠”，综合成本低至约0.53美元/百万Tokens，不及Claude 4.5 Sonnet的8%，推理速度是其近两倍。MiniMax相关负责人介绍说，M2专为编码与智能体任务深度优化，非常契合新兴多智能体工作流对高效协同与快速响应的需求。

10月28日，MiniMax最新视频生成模型海螺2.3（Hailuo 2.3）正式发布。据介绍，这款在Hailuo 02模型基础上实现全面技术升级的新版本，在动态表现力、风格化呈现以及人物表演细腻度方面取得了显著突破。其技术亮点主要提现在强大的动态表现力、风格化创作能力的显著提升、人物表演的自然度大幅提升3个方面。

在成本控制方面，海螺2.3在提升性能表现的同时保持了Hailuo 02的原有定价水平，实现了”加量不加价”。同时推出的海螺2.3 Fast版本，在保证画质和表现力的基础上大幅提升了生成速度，并采用了更低的定价策略。

MiniMax发布的Speech 2.6模型专门针对Voice Agent场景进行了深度优化，将首包响应时间压缩到250毫秒。除此之外，该模型新增的Fluent Lora功能能够将磕磕巴巴的原始录音复刻成流畅自然的声音。

MiniMax发布的音乐生成模型Music 2.0在人声表现方面实现了新的突破，音色无限接近真实人声，能够驾驭多种唱法和情感风格，支持男女对唱、阿卡贝拉等风格。模型还支持对人声音色的精准控制，可以在保持核心音色的基础上，让同一声音切换不同唱法，实现”一声千变”。此外，在器乐控制方面，Music 2.0能够生成包含主歌、副歌、桥段等逻辑清晰、结构完整的歌曲，单首时长可达5分钟。

“AI技术正在改变越来越多人的工作和创作方式，我们希望成为创作者的全能助手和创新先锋，让每一个灵感都能超越形式的限制。”前述负责人表示。

12月15日至16日，国家自然科学基金委员会管理科学部主办、首都经济贸易大学承办的数据要素与数字经济高层研讨会在首 “忙”，已经成为很多科研人员的常态，他们忙着很多事，唯独很难静下心来忙学问。中国科学院院士刘忠范将很多被迫忙碌 ■本报记者冯丽妃日本当地时间1月1日16时10分，日本西海岸石川县能登半岛发生7.6级地震，震源深度30公里。截至问：据媒体报道，一名中国留学生在美国犹他州疑似遭遇绑架。中国使馆能否证实此事并介绍情况？答：中国驻美国大使馆高度重视科技日报讯（记者张佳欣）当有人开始哭泣时，其他人常常会感到同情和关心，但其背后的生物学原因不仅仅是激发了同情心。据据江苏省扬州市职业大学网站消息，扬州市职业大学教学督导室2023年12月28日发布《2023-2024学年第一学期教师及学生座谈。

本文链接：MiniMax发布全模态模型“全家桶”http://www.sushuapos.com/show-11-27698-0.html

声明：本网站为非营利性网站，本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：深圳先进院多项海洋科技成果亮相大鹏湾

下一篇：北大医学高质量科技创新人才论坛（2025）暨第四届北京大学屠呦呦青年学者奖、第七届北大医学青年科技奖颁奖典礼召开

MiniMax发布全模态模型“全家桶”

热门资讯

推荐资讯

科学最热文章