设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

技术突破驱动成本下降 多款国产大模型宣布降价

发布时间: 2026-06-17 12:12:18 来源: 证券日报

近期,DeepSeek、小米、腾讯云等头部国产大模型运营主体接连宣布下调API(应用程序编程接口)调用费用,多款主流模型降价幅度突破90%。5bc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

有行业分析师对《证券日报》记者表示,大模型API价格的接连下探,本质上是技术红利释放与市场竞争博弈共振的结果。一方面,底层模型架构的不断迭代与推理系统效能的深度挖掘,正推动单位词元(Token)的计算成本实现阶梯式下降,为价格体系的重塑提供了底层支撑;另一方面,白热化的市场角逐进一步加速了这一进程,使得降价成为厂商在激烈竞争中抢占身位的现实选择。5bc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

降价动作频频5bc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本轮国产大模型降价周期集中在5月下旬至6月中旬,降价力度逐层加码,接连打破全球商用大模型API底价纪录。5bc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

5月22日,DeepSeek率先启动调价,其旗下旗舰级通用大模型V4-Pro开启永久性降价,整体降幅达到75%;依托缓存加速技术,该模型输入侧缓存命中单价跌至0.025元/百万词元,成为当前全球公开报价最低的顶级能力大模型。5bc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

仅仅5天后,小米紧随其后完成调价动作,其旗下MiMo-V2.5全系列API接口永久下调资费,部分细分调用场景降价比例逼近99%,成为本轮降价潮中单次降幅最高的厂商。5bc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

头部公有云厂商也快速跟进。6月2日腾讯云发布服务调价公告,明确自6月3日起,平台内上线的DeepSeek-V4全系列模型同步下调调用价格,最高降幅达到97.5%。腾讯云同时强调,本次调整仅修改计费标准,模型推理速度、上下文窗口、输出准确率等核心服务参数不做任何改动,用户使用体验不受影响。5bc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯云后续还在6月12日推出第二轮差异化调价,覆盖自研与第三方两类商用模型。首先落地调价的是自研多语言翻译模型Hy-MT2-Pro,输入词元计费下调66.67%、输出词元计费下调55.56%;针对第三方入驻模型MiniMax-M3,则设定延后调价节点,定于6月15日统一下调推理输入、推理输出、缓存命中三项费用,各项降幅均为50%。5bc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

值得关注的是,本轮降价完全背离上游算力市场走势。2026年上半年,AI硬件供应链供需矛盾持续激化,核心存储部件HBM(高带宽内存)半年内市价涨幅超500%,英伟达高端GPU(图形处理器)现货长期供不应求,海外亚马逊云、微软Azure以及国内少量中小型云厂商早已启动涨价,部分海外厂商API最高涨幅甚至达到463%。5bc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

一涨一跌的反向走势,让国产大模型的竞争策略差异彻底凸显。5bc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

广州艾媒数聚信息咨询股份有限公司CEO张毅对《证券日报》记者表示,国内大模型行业已经走完前期烧钱试错的技术验证阶段,全面迈入商业化落地攻坚期。对于中小开发者、垂直小微企业而言,本次大范围降价直接降低AI创业试错成本。在预算不变的前提下,团队可调用的模型词元总量能够提升数倍至近百倍,原本受资金限制无法落地的轻量化AI工具、行业定制插件,如今具备了商业化测试条件,小众创新团队的生存空间得到明显拓宽。5bc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

多重因素形成支撑5bc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

抛开市场竞争因素,业内人士普遍认为,多级存储缓存优化、稀疏算力架构迭代、国产算力适配三大技术突破,是厂商能够逆势降价的核心支撑,上游硬件涨价的压力已经被推理层技术优化所对冲。5bc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

小米官方披露了MiMo模型的降本技术路径:研发团队基于SGLang(结构化生成语言)框架配套HiCache(配套高速)缓存方案,完整兼容滑动窗口注意力(SWA)算法。通过重构词元缓存调度逻辑,将KV(键值)缓存在GPU显存、CPU(中央处理器)内存、固态硬盘三级存储之间的数据迁移量压缩至原先的1/7,同时把系统可长效缓存的词元容量提升5倍。除此之外,团队还优化了混合专家模型的并行调度逻辑,新增输入文本长度分桶匹配策略,解决了超长文本并发调用时集群算力浪费问题,集群整体吞吐效率提升后,单词元的平均推理成本自然下降。5bc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek则从模型原生架构和算力国产化两条路径实现降本。架构层面,自研轻量化稀疏注意力机制搭配动态混合专家结构,让V4系列模型处理十万级至百万级超长上下文时,算力资源消耗仅为上一代版本的27%,KV缓存显存占用直接压缩90%;算力适配层面,该模型完成了昇腾系列国产算力芯片的深度底层适配,摆脱了对海外高端GPU的单一依赖。一方面降低了硬件采购与长期租赁成本,另一方面也补齐了国产算力生态的商用落地案例,实现技术与成本双向收益。5bc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

张毅表示,未来大模型价格将呈现两极分化走势:基础推理服务价格因技术迭代和规模效应持续下探,逐步接近公用事业定价;而高端定制化服务将维持溢价。行业竞争焦点正从算力堆砌转向效率优化与生态构建,具备自主架构创新能力和国产算力适配能力的企业有望胜出,缺乏技术护城河的厂商将面临出清压力。5bc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

近期,DeepSeek、小米、腾讯云等头部国产大模型运营主体接连宣布下调API(应用程序编程接口)调用费用,多款主流模型降价幅度突破90%。5bc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

有行业分析师对《证券日报》记者表示,大模型API价格的接连下探,本质上是技术红利释放与市场竞争博弈共振的结果。一方面,底层模型架构的不断迭代与推理系统效能的深度挖掘,正推动单位词元(Token)的计算成本实现阶梯式下降,为价格体系的重塑提供了底层支撑;另一方面,白热化的市场角逐进一步加速了这一进程,使得降价成为厂商在激烈竞争中抢占身位的现实选择。5bc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

降价动作频频5bc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本轮国产大模型降价周期集中在5月下旬至6月中旬,降价力度逐层加码,接连打破全球商用大模型API底价纪录。5bc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

5月22日,DeepSeek率先启动调价,其旗下旗舰级通用大模型V4-Pro开启永久性降价,整体降幅达到75%;依托缓存加速技术,该模型输入侧缓存命中单价跌至0.025元/百万词元,成为当前全球公开报价最低的顶级能力大模型。5bc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

仅仅5天后,小米紧随其后完成调价动作,其旗下MiMo-V2.5全系列API接口永久下调资费,部分细分调用场景降价比例逼近99%,成为本轮降价潮中单次降幅最高的厂商。5bc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

头部公有云厂商也快速跟进。6月2日腾讯云发布服务调价公告,明确自6月3日起,平台内上线的DeepSeek-V4全系列模型同步下调调用价格,最高降幅达到97.5%。腾讯云同时强调,本次调整仅修改计费标准,模型推理速度、上下文窗口、输出准确率等核心服务参数不做任何改动,用户使用体验不受影响。5bc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯云后续还在6月12日推出第二轮差异化调价,覆盖自研与第三方两类商用模型。首先落地调价的是自研多语言翻译模型Hy-MT2-Pro,输入词元计费下调66.67%、输出词元计费下调55.56%;针对第三方入驻模型MiniMax-M3,则设定延后调价节点,定于6月15日统一下调推理输入、推理输出、缓存命中三项费用,各项降幅均为50%。5bc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

值得关注的是,本轮降价完全背离上游算力市场走势。2026年上半年,AI硬件供应链供需矛盾持续激化,核心存储部件HBM(高带宽内存)半年内市价涨幅超500%,英伟达高端GPU(图形处理器)现货长期供不应求,海外亚马逊云、微软Azure以及国内少量中小型云厂商早已启动涨价,部分海外厂商API最高涨幅甚至达到463%。5bc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

一涨一跌的反向走势,让国产大模型的竞争策略差异彻底凸显。5bc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

广州艾媒数聚信息咨询股份有限公司CEO张毅对《证券日报》记者表示,国内大模型行业已经走完前期烧钱试错的技术验证阶段,全面迈入商业化落地攻坚期。对于中小开发者、垂直小微企业而言,本次大范围降价直接降低AI创业试错成本。在预算不变的前提下,团队可调用的模型词元总量能够提升数倍至近百倍,原本受资金限制无法落地的轻量化AI工具、行业定制插件,如今具备了商业化测试条件,小众创新团队的生存空间得到明显拓宽。5bc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

多重因素形成支撑5bc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

抛开市场竞争因素,业内人士普遍认为,多级存储缓存优化、稀疏算力架构迭代、国产算力适配三大技术突破,是厂商能够逆势降价的核心支撑,上游硬件涨价的压力已经被推理层技术优化所对冲。5bc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

小米官方披露了MiMo模型的降本技术路径:研发团队基于SGLang(结构化生成语言)框架配套HiCache(配套高速)缓存方案,完整兼容滑动窗口注意力(SWA)算法。通过重构词元缓存调度逻辑,将KV(键值)缓存在GPU显存、CPU(中央处理器)内存、固态硬盘三级存储之间的数据迁移量压缩至原先的1/7,同时把系统可长效缓存的词元容量提升5倍。除此之外,团队还优化了混合专家模型的并行调度逻辑,新增输入文本长度分桶匹配策略,解决了超长文本并发调用时集群算力浪费问题,集群整体吞吐效率提升后,单词元的平均推理成本自然下降。5bc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek则从模型原生架构和算力国产化两条路径实现降本。架构层面,自研轻量化稀疏注意力机制搭配动态混合专家结构,让V4系列模型处理十万级至百万级超长上下文时,算力资源消耗仅为上一代版本的27%,KV缓存显存占用直接压缩90%;算力适配层面,该模型完成了昇腾系列国产算力芯片的深度底层适配,摆脱了对海外高端GPU的单一依赖。一方面降低了硬件采购与长期租赁成本,另一方面也补齐了国产算力生态的商用落地案例,实现技术与成本双向收益。5bc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

张毅表示,未来大模型价格将呈现两极分化走势:基础推理服务价格因技术迭代和规模效应持续下探,逐步接近公用事业定价;而高端定制化服务将维持溢价。行业竞争焦点正从算力堆砌转向效率优化与生态构建,具备自主架构创新能力和国产算力适配能力的企业有望胜出,缺乏技术护城河的厂商将面临出清压力。5bc速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  239万的无人驾驶航空器淘宝上架,人人可以“打飞的”还有多远  239万元/架的无人驾驶载人航空器也看上了电商渠道。  3月18日,亿航智能设备(广州)有限公司(下称“亿航智能”)在淘宝上架了其生产的EH216-S无人驾 美国《新闻周刊》网站2月4日刊登题为《人工智能可能会在数十年内解开人体的秘密》的文章,作者是亚历克斯·菲利普斯,内容编译如下:一位医生(同时也是一本关于新兴技术在医疗领域应用的新 “当时是怎样选中低空经济这个领域,并且来深圳发展的?”面对这个关乎事业发展的问题,“95后”台青张晏纶坦言,“这是一场面试带来的惊喜。”张晏纶来自台湾台中市,本科就读于台湾成功大学机械工程 聊到安卓电话的拍照,大部分用户还是比较认可的,而在与iPhone电话的对比中,用户也普遍以为安卓电话的拍照水平要比iPhone更好,当然这一说法也并非空穴来风,其背后的原因直接而明确。首先,硬件配置的竞争 在日常生活中,隧道可以帮助人们翻山越岭。在植物细胞内,当内部物质穿过细胞膜时,往往也会通过类似的“隧道”。记者从中国科学技术大学获悉,该校孙林峰团队在第六大植物激素——油菜素 全球首台无细胞蛋白质合成生物反应器、全球首台全高温超导托卡马克装置(洪荒70)、64比特超导量子计算机研发与产业化项目、深海可燃冰探采重载作业机器人系统研制、载人电动复合翼垂直起降飞行 。

本文链接:技术突破驱动成本下降 多款国产大模型宣布降价http://www.sushuapos.com/show-2-16533-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 一束“光”照进智造产业

下一篇: 超表面元件让太阳磁场测量“一气呵成”

热门资讯

  • 电驱气吸播种机亮相农机展,价格亲民助增产

    3月18日,在2024年黑龙江农机产品展示交易会上,一部可智能播种,又可助力增产的电驱气吸播种机引发众人关注。这台高端智能电驱气吸播种机的价格与机械

  • 多功能金纳米花颗粒 可促进感染性组织修复

    3月17日,记者从海南大学获悉,该校化学化工学院副教授李萌婷与相关研究团队合作,合成了多功能复合金纳米花颗粒。该颗粒配合温和光热、光动力、药物控

  • Kimi概念股风起:月之暗面的资本征途与技术突破

    21世纪经济报道记者雷晨 北京报道随着人工智能技术的飞速发展,Kimi概念股成为资本市场的新宠。3月21日,受Kimi智能助手技术突破的催化,相关概

  • 植物避盐性的关键基因被发现

    记者3月21日从安徽农业大学获悉,该校生命科学学院韩毅教授课题组与国内外专家合作,发现了植物避盐性的关键基因。该研究对于提高植物耐盐性,帮助盐碱

  • AI伴侣能否带来亲密关系

    自2023年以来,人工智能的“触角”已延伸到生活的方方面面。其中,“人工智能+情感”的赛道正悄然崛起。目前,国内外已经出现了多款较为成熟的AI伴侣应

  • AI芯片巨头低调赚钱

      AI芯片巨头低调赚钱  骆轶琪  在过去一年半导体行业下行周期中,除了英伟达以GPU霸主身份实现业绩快速成长之外,另一些主营虽非GPU,但是立足于AI定制芯片市场的半导体巨

  • “AI热潮”有人欢喜又有人忧:新兴市场遭资金外流!

      “AI热潮”有人欢喜又有人忧:新兴市场遭资金外流!  财联社3月20日讯(编辑 黄君芝)巴西亿万富翁、巴西金融公司Banco BTG Pactual SA创始人Andre Esteves表示,人工智能(AI

  • 【科技强国有我】让青年科技人才敢坐“冷板凳”

    习近平总书记在中共中央政治局第三次集体学习时强调,要加强科研学风作风建设,引导科技人员摒弃浮夸、祛除浮躁,坐住坐稳“冷板凳”。甘坐“冷板凳”是

  • 外媒:夏普拟缩小液晶业务,旗下显示器或停产

      中新经纬3月22日电 据《日本经济新闻》22日报道,夏普正在讨论缩小液晶显示器业务,夏普已将子公司显示器(SDP、位于市)停产纳入视野。显示器业务持续陷入苦战,成为夏普在202

  • Kimi掀起国产大模型长文本竞赛

    作为月之暗面的创始人,杨植麟常把他的AGI梦想形容为“登月计划”,长文本就是这个伟大计划的第一步。但现在,随着Kimi的爆火出圈,赛道瞬间变得

  • 诺基亚手机“掉队”带来的启示

    作为功能机时代的霸主,诺基亚手机曾经创造了巨大的辉煌,但也因错失智能手机发展机遇而“掉队”。近期,外媒Visual Capitalist统计了有史以来最畅销的1

  • “穿上就走”的通用外骨骼面世

    美国佐治亚理工学院机械工程师开发了一种控制机器人外骨骼的通用方法。无需专门训练、特别校准,对复杂算法进行调整后,用户穿上外骨骼就可以直接行走

推荐资讯

  • 日榜
  • 周榜
  • 月榜