设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

技术突破驱动成本下降 多款国产大模型宣布降价

发布时间: 2026-06-18 16:08:58 来源: 证券日报

近期,DeepSeek、小米、腾讯云等头部国产大模型运营主体接连宣布下调API(应用程序编程接口)调用费用,多款主流模型降价幅度突破90%。Urf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

有行业分析师对《证券日报》记者表示,大模型API价格的接连下探,本质上是技术红利释放与市场竞争博弈共振的结果。一方面,底层模型架构的不断迭代与推理系统效能的深度挖掘,正推动单位词元(Token)的计算成本实现阶梯式下降,为价格体系的重塑提供了底层支撑;另一方面,白热化的市场角逐进一步加速了这一进程,使得降价成为厂商在激烈竞争中抢占身位的现实选择。Urf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

降价动作频频Urf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本轮国产大模型降价周期集中在5月下旬至6月中旬,降价力度逐层加码,接连打破全球商用大模型API底价纪录。Urf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

5月22日,DeepSeek率先启动调价,其旗下旗舰级通用大模型V4-Pro开启永久性降价,整体降幅达到75%;依托缓存加速技术,该模型输入侧缓存命中单价跌至0.025元/百万词元,成为当前全球公开报价最低的顶级能力大模型。Urf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

仅仅5天后,小米紧随其后完成调价动作,其旗下MiMo-V2.5全系列API接口永久下调资费,部分细分调用场景降价比例逼近99%,成为本轮降价潮中单次降幅最高的厂商。Urf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

头部公有云厂商也快速跟进。6月2日腾讯云发布服务调价公告,明确自6月3日起,平台内上线的DeepSeek-V4全系列模型同步下调调用价格,最高降幅达到97.5%。腾讯云同时强调,本次调整仅修改计费标准,模型推理速度、上下文窗口、输出准确率等核心服务参数不做任何改动,用户使用体验不受影响。Urf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯云后续还在6月12日推出第二轮差异化调价,覆盖自研与第三方两类商用模型。首先落地调价的是自研多语言翻译模型Hy-MT2-Pro,输入词元计费下调66.67%、输出词元计费下调55.56%;针对第三方入驻模型MiniMax-M3,则设定延后调价节点,定于6月15日统一下调推理输入、推理输出、缓存命中三项费用,各项降幅均为50%。Urf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

值得关注的是,本轮降价完全背离上游算力市场走势。2026年上半年,AI硬件供应链供需矛盾持续激化,核心存储部件HBM(高带宽内存)半年内市价涨幅超500%,英伟达高端GPU(图形处理器)现货长期供不应求,海外亚马逊云、微软Azure以及国内少量中小型云厂商早已启动涨价,部分海外厂商API最高涨幅甚至达到463%。Urf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

一涨一跌的反向走势,让国产大模型的竞争策略差异彻底凸显。Urf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

广州艾媒数聚信息咨询股份有限公司CEO张毅对《证券日报》记者表示,国内大模型行业已经走完前期烧钱试错的技术验证阶段,全面迈入商业化落地攻坚期。对于中小开发者、垂直小微企业而言,本次大范围降价直接降低AI创业试错成本。在预算不变的前提下,团队可调用的模型词元总量能够提升数倍至近百倍,原本受资金限制无法落地的轻量化AI工具、行业定制插件,如今具备了商业化测试条件,小众创新团队的生存空间得到明显拓宽。Urf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

多重因素形成支撑Urf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

抛开市场竞争因素,业内人士普遍认为,多级存储缓存优化、稀疏算力架构迭代、国产算力适配三大技术突破,是厂商能够逆势降价的核心支撑,上游硬件涨价的压力已经被推理层技术优化所对冲。Urf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

小米官方披露了MiMo模型的降本技术路径:研发团队基于SGLang(结构化生成语言)框架配套HiCache(配套高速)缓存方案,完整兼容滑动窗口注意力(SWA)算法。通过重构词元缓存调度逻辑,将KV(键值)缓存在GPU显存、CPU(中央处理器)内存、固态硬盘三级存储之间的数据迁移量压缩至原先的1/7,同时把系统可长效缓存的词元容量提升5倍。除此之外,团队还优化了混合专家模型的并行调度逻辑,新增输入文本长度分桶匹配策略,解决了超长文本并发调用时集群算力浪费问题,集群整体吞吐效率提升后,单词元的平均推理成本自然下降。Urf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek则从模型原生架构和算力国产化两条路径实现降本。架构层面,自研轻量化稀疏注意力机制搭配动态混合专家结构,让V4系列模型处理十万级至百万级超长上下文时,算力资源消耗仅为上一代版本的27%,KV缓存显存占用直接压缩90%;算力适配层面,该模型完成了昇腾系列国产算力芯片的深度底层适配,摆脱了对海外高端GPU的单一依赖。一方面降低了硬件采购与长期租赁成本,另一方面也补齐了国产算力生态的商用落地案例,实现技术与成本双向收益。Urf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

张毅表示,未来大模型价格将呈现两极分化走势:基础推理服务价格因技术迭代和规模效应持续下探,逐步接近公用事业定价;而高端定制化服务将维持溢价。行业竞争焦点正从算力堆砌转向效率优化与生态构建,具备自主架构创新能力和国产算力适配能力的企业有望胜出,缺乏技术护城河的厂商将面临出清压力。Urf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

近期,DeepSeek、小米、腾讯云等头部国产大模型运营主体接连宣布下调API(应用程序编程接口)调用费用,多款主流模型降价幅度突破90%。Urf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

有行业分析师对《证券日报》记者表示,大模型API价格的接连下探,本质上是技术红利释放与市场竞争博弈共振的结果。一方面,底层模型架构的不断迭代与推理系统效能的深度挖掘,正推动单位词元(Token)的计算成本实现阶梯式下降,为价格体系的重塑提供了底层支撑;另一方面,白热化的市场角逐进一步加速了这一进程,使得降价成为厂商在激烈竞争中抢占身位的现实选择。Urf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

降价动作频频Urf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本轮国产大模型降价周期集中在5月下旬至6月中旬,降价力度逐层加码,接连打破全球商用大模型API底价纪录。Urf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

5月22日,DeepSeek率先启动调价,其旗下旗舰级通用大模型V4-Pro开启永久性降价,整体降幅达到75%;依托缓存加速技术,该模型输入侧缓存命中单价跌至0.025元/百万词元,成为当前全球公开报价最低的顶级能力大模型。Urf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

仅仅5天后,小米紧随其后完成调价动作,其旗下MiMo-V2.5全系列API接口永久下调资费,部分细分调用场景降价比例逼近99%,成为本轮降价潮中单次降幅最高的厂商。Urf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

头部公有云厂商也快速跟进。6月2日腾讯云发布服务调价公告,明确自6月3日起,平台内上线的DeepSeek-V4全系列模型同步下调调用价格,最高降幅达到97.5%。腾讯云同时强调,本次调整仅修改计费标准,模型推理速度、上下文窗口、输出准确率等核心服务参数不做任何改动,用户使用体验不受影响。Urf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

腾讯云后续还在6月12日推出第二轮差异化调价,覆盖自研与第三方两类商用模型。首先落地调价的是自研多语言翻译模型Hy-MT2-Pro,输入词元计费下调66.67%、输出词元计费下调55.56%;针对第三方入驻模型MiniMax-M3,则设定延后调价节点,定于6月15日统一下调推理输入、推理输出、缓存命中三项费用,各项降幅均为50%。Urf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

值得关注的是,本轮降价完全背离上游算力市场走势。2026年上半年,AI硬件供应链供需矛盾持续激化,核心存储部件HBM(高带宽内存)半年内市价涨幅超500%,英伟达高端GPU(图形处理器)现货长期供不应求,海外亚马逊云、微软Azure以及国内少量中小型云厂商早已启动涨价,部分海外厂商API最高涨幅甚至达到463%。Urf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

一涨一跌的反向走势,让国产大模型的竞争策略差异彻底凸显。Urf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

广州艾媒数聚信息咨询股份有限公司CEO张毅对《证券日报》记者表示,国内大模型行业已经走完前期烧钱试错的技术验证阶段,全面迈入商业化落地攻坚期。对于中小开发者、垂直小微企业而言,本次大范围降价直接降低AI创业试错成本。在预算不变的前提下,团队可调用的模型词元总量能够提升数倍至近百倍,原本受资金限制无法落地的轻量化AI工具、行业定制插件,如今具备了商业化测试条件,小众创新团队的生存空间得到明显拓宽。Urf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

多重因素形成支撑Urf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

抛开市场竞争因素,业内人士普遍认为,多级存储缓存优化、稀疏算力架构迭代、国产算力适配三大技术突破,是厂商能够逆势降价的核心支撑,上游硬件涨价的压力已经被推理层技术优化所对冲。Urf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

小米官方披露了MiMo模型的降本技术路径:研发团队基于SGLang(结构化生成语言)框架配套HiCache(配套高速)缓存方案,完整兼容滑动窗口注意力(SWA)算法。通过重构词元缓存调度逻辑,将KV(键值)缓存在GPU显存、CPU(中央处理器)内存、固态硬盘三级存储之间的数据迁移量压缩至原先的1/7,同时把系统可长效缓存的词元容量提升5倍。除此之外,团队还优化了混合专家模型的并行调度逻辑,新增输入文本长度分桶匹配策略,解决了超长文本并发调用时集群算力浪费问题,集群整体吞吐效率提升后,单词元的平均推理成本自然下降。Urf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek则从模型原生架构和算力国产化两条路径实现降本。架构层面,自研轻量化稀疏注意力机制搭配动态混合专家结构,让V4系列模型处理十万级至百万级超长上下文时,算力资源消耗仅为上一代版本的27%,KV缓存显存占用直接压缩90%;算力适配层面,该模型完成了昇腾系列国产算力芯片的深度底层适配,摆脱了对海外高端GPU的单一依赖。一方面降低了硬件采购与长期租赁成本,另一方面也补齐了国产算力生态的商用落地案例,实现技术与成本双向收益。Urf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

张毅表示,未来大模型价格将呈现两极分化走势:基础推理服务价格因技术迭代和规模效应持续下探,逐步接近公用事业定价;而高端定制化服务将维持溢价。行业竞争焦点正从算力堆砌转向效率优化与生态构建,具备自主架构创新能力和国产算力适配能力的企业有望胜出,缺乏技术护城河的厂商将面临出清压力。Urf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

3月18日,荣耀在国内市场发布全新AI使能的全场景战略,推出平台级AI赋能、以人为中心的跨操作系统体验,以及与全球产业链共振创新的一系列智能设备。荣耀CEO赵明表示,人工智能大模型时代,他们的AI战 3月18日,在2024年黑龙江农机产品展示交易会上,一部可智能播种,又可助力增产的电驱气吸播种机引发众人关注。这台高端智能电驱气吸播种机的价格与机械播种机价格相当,据悉,研发团队通过自主研发和   诺贝尔化学奖获得者阿龙・切哈诺沃:做研究保持好奇心很重要  中新网宁波3月17日电(林波)对于学生而言,如何找到研究的信心和价值,让他们有继续下去的动力?  “做研究保持好奇心很重要。”3月17日,2004年诺贝尔化学   马斯克开源3140亿参数的Grok,大模型争相开源所为何求?  作者:刘晓洁  特斯拉CEO埃隆・马斯克(Elon Musk)给大模型领域投下一枚重磅炸弹。  北京时间3月18日凌晨,马斯克旗下大模型公司 xAI 在官网宣布开源 3140 根据《天体物理学杂志》的最新报道,一个国际天文学家团队利用欧洲空间局的盖亚(Gaia)太空望远镜收集的数据,创建了迄今为止最庞大的三维宇宙地图。该地图涵盖了大约130万个活跃类星体的精确空间 记者3月21日从核工业北京地质研究院(以下简称核地研院)获悉,该院自1959年成立以来,在天然铀保障、高放废物地质处置、核遥感技术与应用、分析测试等领域科技攻关,以及重点工程建设、国际合作交流 。

本文链接:技术突破驱动成本下降 多款国产大模型宣布降价http://www.sushuapos.com/show-2-16593-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 一束“光”照进智造产业

下一篇: 超表面元件让太阳磁场测量“一气呵成”

热门资讯

  • 诺贝尔化学奖获得者阿龙・切哈诺沃:做研究保持好奇心很重要

      诺贝尔化学奖获得者阿龙・切哈诺沃:做研究保持好奇心很重要  中新网宁波3月17日电(林波)对于学生而言,如何找到研究的信心和价值,让他们有继续下去的动力?  “做研究保

  • Sora将如何影响科学与社会

    英国《自然》周刊网站3月12日刊登题为《OpenAI的文生视频工具Sora会如何改变科学——以及社会》的文章,作者为乔纳森·奥卡拉汉,内

  • 日学者提出“深海激励化学”新概念

    日本《朝日新闻》近日发表题为《深海之光——极端环境是创意宝库》的文章,作者是樱井林太郎,编译如下:在被称为最后未开垦地的深海,有着低温

  • CRISPR能消除培养细胞中艾滋病病毒

    荷兰阿姆斯特丹大学医学院科学家开展的一项新研究证明,利用最新CRISPR-Cas基因编辑技术,能消除实验室中受感染细胞内所有艾滋病病毒(HIV)的痕迹,为治愈

  • 科学新发现丨有史以来最大的三维宇宙地图发布

    根据《天体物理学杂志》的最新报道,一个国际天文学家团队利用欧洲空间局的盖亚(Gaia)太空望远镜收集的数据,创建了迄今为止最庞大的三维宇宙地图。该地

  • 培生2023年财报业绩超出预期,持续加码数字产品

    21世纪经济报道记者王峰北京报道 近日,全球教育集团培生(NYSE:PSO)公布2023财年财报。2023财年,培生的销售额为36.74亿英镑(下同),同比下降4%,但基

  • AI+智能家居赋能健康睡眠

    3月21日是第二十五个“世界睡眠日”,中国睡眠研究会联合慕思集团在北京正式发布《2024情绪与健康睡眠白皮书》(以下简称《白皮书》)。《白皮书》指出,

  • 新研究揭示 光合作用进化“缺失的一环”

    一个国际团队近日在英国《自然》杂志上发表论文说,他们利用湖水样本培养出一种奇特的光合细菌,它属于绿弯菌门一种此前未知的目,代表了光合作用生物进

  • Sora带来的深层次影响值得关注

    2024年2月,OpenAI公司推出了文生视频人工智能(AI)模型Sora。OpenAI展示了Sora利用少量简短文字提示即可创建逼真视频的能力,并提供了包括一位女士在闪

  • 我国成功发射云海二号02组卫星

      我国成功发射云海二号02组卫星  中新网北京3月21日电(马帅莎 曹译 张艳)北京时间2024年3月21日13时27分,我国在酒泉卫星发射中心使用长征二号丁运载火箭/远征三号上面

  • huawei回应P70预售时间曝光:假的 最近没有官方消息透露

    3月22日消息,根据huawei旗舰机型迭代策略,今年上半年将发布影像旗舰huaweiP70系列。然而,这两天一张流出的图片声称huaweiP70将于3月23日开始预售,并附有各

  • 1799元!红米狙击一加Ace3V 简直就是来捣乱的

    一加Ace 3V刚发布,就被红米砍了一刀!随着昨天一加Ace 3V的发布,新一轮中端机的内卷终于拉开了序幕。 而且这电话售价居然还不增反降,直接1999起步。 先来回

推荐资讯

  • 日榜
  • 周榜
  • 月榜