解决传统架构记忆瓶颈 MiniMax发布新一代模型

发布时间: 2025-01-16 09:56:39 来源：新京报

观看：182

1月15日，“AI六小虎”之一的MiniMax发布并开源了新一代01系列模型，包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型使用多项突破性创新，以大规模应用线性注意力机制打破了Transformer传统架构的记忆瓶颈。

未来，AI智能体有望成为最重要的产品形态，由于智能体处理的任务变得越来越复杂，涉及的数据量也越来越大，单个智能体的记忆以及多个智能体协作间的上下文都会变得越来越长。因此，长上下文能力与多模态处理能力的提升至关重要。

技术上，MiniMax-01系列模型首次将线性注意力机制扩展到商用模型的级别，受益于此次架构创新，该系列模型在处理长输入的时候具有非常高的效率，接近线性复杂度。从规模效应、结构设计、训练优化和推理优化等层面综合考虑，MiniMax选择模型参数量为4560亿，其中每次激活459亿，能够高效处理400万token的上下文，将有效替代Transformer传统架构并开启超长文本输入时代。相较于Gemini等一众全球顶级模型，MiniMax-01随着输入长度变长，性能衰减最慢。

值得注意的是，MiniMax还开源了Text-01模型、VL-01模型的完整权重，以便于更多开发者做有价值、突破性的研究。MiniMax方面表示，“我们认为这有可能启发更多长上下文的研究和应用，从而更快促进Agent时代的到来，二是开源也能促使我们努力做更多创新，更高质量地开展后续的模型研发工作。”

1月15日，“AI六小虎”之一的MiniMax发布并开源了新一代01系列模型，包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型使用多项突破性创新，以大规模应用线性注意力机制打破了Transformer传统架构的记忆瓶颈。

未来，AI智能体有望成为最重要的产品形态，由于智能体处理的任务变得越来越复杂，涉及的数据量也越来越大，单个智能体的记忆以及多个智能体协作间的上下文都会变得越来越长。因此，长上下文能力与多模态处理能力的提升至关重要。

技术上，MiniMax-01系列模型首次将线性注意力机制扩展到商用模型的级别，受益于此次架构创新，该系列模型在处理长输入的时候具有非常高的效率，接近线性复杂度。从规模效应、结构设计、训练优化和推理优化等层面综合考虑，MiniMax选择模型参数量为4560亿，其中每次激活459亿，能够高效处理400万token的上下文，将有效替代Transformer传统架构并开启超长文本输入时代。相较于Gemini等一众全球顶级模型，MiniMax-01随着输入长度变长，性能衰减最慢。

值得注意的是，MiniMax还开源了Text-01模型、VL-01模型的完整权重，以便于更多开发者做有价值、突破性的研究。MiniMax方面表示，“我们认为这有可能启发更多长上下文的研究和应用，从而更快促进Agent时代的到来，二是开源也能促使我们努力做更多创新，更高质量地开展后续的模型研发工作。”

　　马斯克开源3140亿参数的Grok，大模型争相开源所为何求？　　作者：刘晓洁　　特斯拉CEO埃隆・马斯克(Elon Musk)给大模型领域投下一枚重磅炸弹。　　北京时间3月18日凌晨，马斯克旗下大模型公司 xAI 在官网宣布开源 3140 据埃菲社报道，多发性骨髓瘤是成年人中继淋巴瘤之后第二常见的血液肿瘤。最近，西班牙的一个科研团队开发出了一种新的免疫疗法来对抗它。实验室实验表明，这种新疗法比目前优先使用的免疫疗法更有自2019年以来，科学家已经在国际空间站上培育出了包括人类大脑、心脏和乳房在内的多个类器官模型。这些类器官通常利用人类干细胞培育而成，在一系列化学生长物质的帮助下，干细胞可发育成类似人体 3月22日消息，今天，数码博主“数码闲聊站”曝光了一部新款千元机的部分配置。该博主表示，欧加（OPPO/一加）有个5500mAh超大电池的千元曲屏机，正在测试IP68级防尘防水效果，主打就是防水抗摔耐用。该博主最 3月24日消息，今天数码博主“厂长是关同学”曝光了huaweiMate 70系列电话的部分配置信息。该博主表示，huawei全新的Mate 70系列首发会搭载新的芯片，芯片的性能差不多可以比肩5.5nm，还是值得期待的。同回望一加去年的整体节奏，如果要用一个词来总结其数字系列和Ace系列的概况，那就是“卷”！从外观质感、内存性能到整机体验，与友商的相互竞争中，一加表现的都比较强势，搭配清晰的产品定位策略和稳扎稳打。

本文链接：解决传统架构记忆瓶颈 MiniMax发布新一代模型http://www.sushuapos.com/show-2-10161-0.html

声明：本网站为非营利性网站，本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：深瞳丨AI为药物研发按下“快进键”

下一篇：丝巾变色、火柴变玫瑰年货节期间淘宝魔术道具销量大增174%

解决传统架构记忆瓶颈 MiniMax发布新一代模型

热门资讯

推荐资讯

科技最热文章