设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

解决传统架构记忆瓶颈 MiniMax发布新一代模型

发布时间: 来源: 新京报

1月15日,“AI六小虎”之一的MiniMax发布并开源了新一代01系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型使用多项突破性创新,以大规模应用线性注意力机制打破了Transformer传统架构的记忆瓶颈。pet速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

未来,AI智能体有望成为最重要的产品形态,由于智能体处理的任务变得越来越复杂,涉及的数据量也越来越大,单个智能体的记忆以及多个智能体协作间的上下文都会变得越来越长。因此,长上下文能力与多模态处理能力的提升至关重要。pet速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

技术上,MiniMax-01系列模型首次将线性注意力机制扩展到商用模型的级别,受益于此次架构创新,该系列模型在处理长输入的时候具有非常高的效率,接近线性复杂度。从规模效应、结构设计、训练优化和推理优化等层面综合考虑,MiniMax选择模型参数量为4560亿,其中每次激活459亿,能够高效处理400万token的上下文,将有效替代Transformer传统架构并开启超长文本输入时代。相较于Gemini等一众全球顶级模型,MiniMax-01随着输入长度变长,性能衰减最慢。pet速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

值得注意的是,MiniMax还开源了Text-01模型、VL-01模型的完整权重,以便于更多开发者做有价值、突破性的研究。MiniMax方面表示,“我们认为这有可能启发更多长上下文的研究和应用,从而更快促进Agent时代的到来,二是开源也能促使我们努力做更多创新,更高质量地开展后续的模型研发工作。”pet速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

1月15日,“AI六小虎”之一的MiniMax发布并开源了新一代01系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型使用多项突破性创新,以大规模应用线性注意力机制打破了Transformer传统架构的记忆瓶颈。pet速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

未来,AI智能体有望成为最重要的产品形态,由于智能体处理的任务变得越来越复杂,涉及的数据量也越来越大,单个智能体的记忆以及多个智能体协作间的上下文都会变得越来越长。因此,长上下文能力与多模态处理能力的提升至关重要。pet速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

技术上,MiniMax-01系列模型首次将线性注意力机制扩展到商用模型的级别,受益于此次架构创新,该系列模型在处理长输入的时候具有非常高的效率,接近线性复杂度。从规模效应、结构设计、训练优化和推理优化等层面综合考虑,MiniMax选择模型参数量为4560亿,其中每次激活459亿,能够高效处理400万token的上下文,将有效替代Transformer传统架构并开启超长文本输入时代。相较于Gemini等一众全球顶级模型,MiniMax-01随着输入长度变长,性能衰减最慢。pet速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

值得注意的是,MiniMax还开源了Text-01模型、VL-01模型的完整权重,以便于更多开发者做有价值、突破性的研究。MiniMax方面表示,“我们认为这有可能启发更多长上下文的研究和应用,从而更快促进Agent时代的到来,二是开源也能促使我们努力做更多创新,更高质量地开展后续的模型研发工作。”pet速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

3月18日,荣耀在国内市场发布全新AI使能的全场景战略,推出平台级AI赋能、以人为中心的跨操作系统体验,以及与全球产业链共振创新的一系列智能设备。荣耀CEO赵明表示,人工智能大模型时代,他们的AI战 北京时间凌晨4点至6点,英伟达联合创始人兼CEO黄仁勋发表主题演讲《见证AI的变革时刻》,正式拉开了2024年英伟达GTC大会的序幕。黄仁勋宣布,正式推出名为Blackwell的新一代AI图形处理器(G   马斯克开源3140亿参数的Grok,大模型争相开源所为何求?  作者:刘晓洁  特斯拉CEO埃隆・马斯克(Elon Musk)给大模型领域投下一枚重磅炸弹。  北京时间3月18日凌晨,马斯克旗下大模型公司 xAI 在官网宣布开源 3140 瑞士洛桑联邦理工学院工程学院研究团队制造了一种用于内存的新型纳米流体设备,这使他们第一次能连接两个“人工突触”。该设备为受大脑启发的液体硬件设计铺平了道路。这项研究发表在最新一期 一加Ace 3V刚发布,就被红米砍了一刀!随着昨天一加Ace 3V的发布,新一轮中端机的内卷终于拉开了序幕。 而且这电话售价居然还不增反降,直接1999起步。 先来回顾下它的配置,外观相比上一代有所变化,依旧是 3月24日,据央视财经消息,在今天开幕的中国发展高层论坛2024年年会现场,苹果公司首席执行官蒂姆·库克回应记者提问表示,苹果公司的Apple Vision Pro头显产品将在今年年内于中国市场上市, 。

本文链接:解决传统架构记忆瓶颈 MiniMax发布新一代模型http://www.sushuapos.com/show-2-10161-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 深瞳丨AI为药物研发按下“快进键”

下一篇: 丝巾变色、火柴变玫瑰 年货节期间淘宝魔术道具销量大增174%

热门资讯

推荐资讯

  • “封关百日,有大企业主动谈合作”

      中新经纬3月27日电 (薛宇飞)“封关100天,我们有三批货物享受了加工增值内销免关税政策,节税8%。”27日,正大(海南)兴隆咖啡产业开发有限公司(下称正大兴隆)总经理叶剑对中

  • 金价银价急跌后直线拉升 贵金属为何“上蹿下跳”|宅男财经

      【宅男财经|专家面对面】27日早间,国际黄金和白银价格经历急跌后直线拉升,现货黄金现涨1.26%,报4437.225美元,现货白银现涨1.67%,报69.224美元。自1月29日达到年内新高后,

  • 天利科技收监管函 事关2025年业绩预告

      中新经纬3月27日电 27日,深交所创业板公司管理部对江西天利科技股份有限公司(下称“天利科技”)出具监管函。  来源:深交所网站  深交所创业板公司管理部表示,2026年1

  • 中国人寿总裁利明光回应单季度亏损:建议拉长周期看报表

      中新经纬3月26日电 (李自曼)“周期越短,受到波动影响会更大,这是经营过程中经常遇到的一个现象。”26日,中国人寿总裁利明光在中国人寿2025年度业绩发布会上说。  财报显

  • 商务部:加强对跨国公司在华投资项目服务保障

      中新经纬3月26日电 商务部新闻发言人何咏前26日表示,加强对跨国公司在华投资项目服务保障,滚动更新重点外资项目清单,在数据跨境流动、研发创新、人才引进等方面给予大力支

  • 外媒:Meta与谷歌因社交媒体成瘾被判赔偿600万美元

      中新经纬3月26日电 据路透社25日报道,洛杉矶一陪审团周三裁定,Meta和Alphabet旗下的谷歌因旗下社交媒体存在对青少年有害的设计,被判赔偿600万美元。这一判决有望成为众多

  • 财政部就2026年中央预算公开答记者问

      中新经纬3月26日电 据财政部网站消息,3月26日,2026年中央部门预算集中向社会公开。就此,财政部有关负责人回答了记者的提问。  一、请介绍一下近年来中央预算公开进展情

  • 雷军辞任金山云董事长

      中新经纬3月26日电 3月25日,金山云控股有限公司(下称“金山云”)发布公告称,雷军因其他工作安排,已辞任非执行董事,自3月25日生效。辞任非执行董事后,雷军亦不再担任董事长、

  • 原晋能集团副总经理冯培一被提起公诉

      中新经纬3月25日电 “最高人民检察院”微信号25日消息,日前,原晋能集团有限公司副总经理冯培一涉嫌受贿罪、挪用公款罪一案,由山西省监察委员会调查终结,移送检察机关审查起

  • 源杰科技扭亏 拟每10股派7元转增4.5股

      中新经纬3月24日电 3月24日,目前A股全市场第二高价股源杰科技披露年报。  2025年,源杰科技营业收入约6.01亿元,同比增长138.50%;归母净利润约1.91亿元,同比扭亏。公司介绍,

  • 7连板华电辽能:股票存短期大幅下跌风险

      中新经纬3月24日电 7连板华电辽能24日晚披露严重异动公告,公司股票交易风险较大,存在短期大幅下跌的风险。  公告显示,截至2026年3月24日收盘,公司股票连续10个交易日内(2

  • 当甄的声音不再属于季冠霖,下一个被AI偷走的会是什么?

      中新经纬3月24日电 (宋亚芬)AI(人工智能)狂飙之下,明星与配音演员正掀起一场“声音与肖像保卫战”。  曾为《甜蜜蜜》黎小军献声的叶清,其独特音色被AI高度复刻,擅自用于

  • 日榜
  • 周榜
  • 月榜