10月最后一周,人工智能“独角兽”上海稀宇极智科技有限公司(即MiniMax)掀起了一场AI技术的“全家桶”发布热潮。继开源文本大模型M2之后,MiniMax接连发布视频模型Hailuo 2.3、语音模型Speech 2.6和音乐模型Music 2.0。
10月27日,MiniMax新一代文本大模型MiniMax-M2宣布发布和开源,这款仅有10B激活参数(总参230B)的轻量级模型在全球权威测评榜单Artificial Analysis (AA)上总分冲入全球前五、开源第一,跻身文本模型第一梯队。
在模型定价方面,该模型“高智能,更实惠”,综合成本低至约0.53美元/百万Tokens,不及Claude 4.5 Sonnet的8%,推理速度是其近两倍。MiniMax相关负责人介绍说,M2专为编码与智能体任务深度优化,非常契合新兴多智能体工作流对高效协同与快速响应的需求。
10月28日,MiniMax最新视频生成模型海螺2.3(Hailuo 2.3)正式发布。据介绍,这款在Hailuo 02模型基础上实现全面技术升级的新版本,在动态表现力、风格化呈现以及人物表演细腻度方面取得了显著突破。其技术亮点主要提现在强大的动态表现力、风格化创作能力的显著提升、人物表演的自然度大幅提升3个方面。
在成本控制方面,海螺2.3在提升性能表现的同时保持了Hailuo 02的原有定价水平,实现了”加量不加价”。同时推出的海螺2.3 Fast版本,在保证画质和表现力的基础上大幅提升了生成速度,并采用了更低的定价策略。
MiniMax发布的Speech 2.6模型专门针对Voice Agent场景进行了深度优化,将首包响应时间压缩到250毫秒。除此之外,该模型新增的Fluent Lora功能能够将磕磕巴巴的原始录音复刻成流畅自然的声音。
MiniMax发布的音乐生成模型Music 2.0在人声表现方面实现了新的突破,音色无限接近真实人声,能够驾驭多种唱法和情感风格,支持男女对唱、阿卡贝拉等风格。模型还支持对人声音色的精准控制,可以在保持核心音色的基础上,让同一声音切换不同唱法,实现”一声千变”。此外,在器乐控制方面,Music 2.0能够生成包含主歌、副歌、桥段等逻辑清晰、结构完整的歌曲,单首时长可达5分钟。
“AI技术正在改变越来越多人的工作和创作方式,我们希望成为创作者的全能助手和创新先锋,让每一个灵感都能超越形式的限制。”前述负责人表示。
当地时间12月17日,美国国家航天航空局(NASA)发表声明称,受不利的天气情况影响,美国国家航天航空局和太空探索技术公司(Spa 流感、肺炎支原体、新型冠状病毒、呼吸道合胞病毒等病原体在这个冬天叠加来袭,让国内医疗机构的发热门诊、儿科门诊异常 编者按 世界在变,变化中不断积蓄着突破的力量。局势纵横看似山重水复,历史规律昭示未来终将柳暗花明。2023年与我们挥 近日,日本政府批准了一项立法,要求6所顶尖大学成立新的管理政策委员会,使外部专家在决策中有更大的发言权。 据《科 科技日报讯 (记者张梦然)日本大阪都立大学科学家设计了一种高效、无创、无痛的方法,从尿液样本中重新编程犬类干细胞,使 我国工程师领域又添了一个国家级的大奖。19日上午,“国家工程师奖”表彰大会在人民大会堂举行,81名个人被授予“国家 。本文链接:MiniMax发布全模态模型“全家桶”http://www.sushuapos.com/show-11-27698-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
上一篇: 深圳先进院多项海洋科技成果亮相大鹏湾
下一篇: 北大医学高质量科技创新人才论坛(2025)暨第四届北京大学屠呦呦青年学者奖、第七届北大医学青年科技奖颁奖典礼召开