新一轮Token价格战打什么
连续两次降价后,DeepSeek又在4月28日将限时优惠延长至5月31日。此前,国内AI行业正处在涨价周期,大模型公司智谱三度提价,月之暗面新模型的输入和输出价格不同程度上涨,云厂商也动作一致。但大模型从“价格战”打到“涨价潮”,没人真正赚到钱,营收和净亏损齐涨。DeepSeek用0.025元抛出了一个问题,当推理成本可以被持续压缩,大模型公司的护城河,究竟是更便宜的Token,还是更不可替代的价值?
DeepSeek逆势降价
DeepSeek的降价来得低调,但并不含蓄。4月24日,DeepSeek全新系列模型DeepSeek-V4的预览版本正式上线并同步开源。该模型按大小分为两个版本:V4-Pro参数较大,1.6T;V4-flash,参数284B。两个版本支持的上下文长度都是100万。“从现在开始,1M(一百万)上下文将是DeepSeek所有官方服务的标配”,DeepSeek特别加粗强调。
当天,DeepSeek公布了两个版本模型的价格,V4-Pro输入(缓存命中)价格1元/百万Tokens,输入(缓存未命中)价格12元/百万Tokens,输出价24元/百万Tokens。同样情况下,V4-flash的价格分别是0.2元/百万Tokens、1元/百万Tokens和2元/百万Tokens。
次日,降价开始,且不止一次。4月25日,DeepSeek开启V4-Pro模型的限时特惠活动,API价格享受2.5折优惠,优惠期限至5月5日。4月26日,DeepSeek全系列模型,输入缓存命中的价格降到原价的1/10。
DeepSeek研究员陈德里在社交平台提醒,“输入(缓存命中)的折扣是永久的,折扣促销活动将持续到5月5日”。
4月28日,DeepSeek又将V4-Pro的2.5折限时优惠,从5月5日延长至5月31日。按此计算,在5月31日之前,V4-Pro模型百万Tokens的输入(缓存命中)价格从原来的1元降到了0.025元。5月31日之后,也只有0.1元。这是DeepSeek这波降价活动中,折扣幅度最大的一项。
何为缓存命中,与缓存未命中有什么区别?一位头部云厂商工程师向北京商报记者解释,“简单说,缓存命中是指模型‘记得’你之前问过类似的内容,可以直接调用记忆回答不参与推理,收费便宜。缓存未命中相反,意思是模型第一次见这个内容,需要从头算一遍,所以收费贵”。
资本市场快速反应。4月27日,即DeepSeek降价后的第一个交易日,智谱和MiniMax的股价出现不同程度下滑。
0.025元的支撑
这个价格不是凭空出现的。
根据官方技术解读,DeepSeek-V4开创了一种全新的注意力机制,在Token维度进行压缩,结合DSA稀疏注意力(DeepSeek Sparse Attention),实现了全球领先的长上下文能力,并且相比于传统方法大幅降低了对计算和显存的需求。
这与外部观察一致。CHIP中国实验室主任罗国昭向北京商报记者分析称,DeepSeek-V4降价“更大程度上跟模型算法优化、同等性能的算力消耗降低有关,和定位同样的大模型相比,V4的优势是在更多参数、更高性能情况下的更低价格”。他也谈及硬件成本,但强调“与采购国产芯片只有宏观的相关性,没有直接和实时的关联”。
另一家大模型厂商从业者楚清(化名)则提供了另一种解释:“看上去是DeepSeek在全栈适配国产算力方面领先,所以敢于定低价。”他的观点建立在DeepSeek模型价位表下的一行小字:“受限于高端算力,目前Pro的服务吞吐十分有限,预计下半年 腾950超节点批量上市后,V4-Pro的价格会大幅下调。”
一个值得注意的插曲是,4月24日也就是DeepSeek模型上新当天,华为计算宣布: 腾一直同步支持DeepSeek系列模型,本次通过双方芯模技术紧密协同,实现 腾超节点全系列产品支持DeepSeek-V4系列模型。
DeepSeek也将华为 腾和英伟达一起写进DeepSeek-V4技术报告:“我们在英伟达GPU和华为 腾NPU平台上验证了细粒度EP(专家并行)方案。”
4月28日,摩根士丹利亚太研究团队发布的最新行业报告《China's AI Path:More Bang For The Buck》也提到,中国模型的“性价比”优势集中体现在:以美国同行15%―20%的推理成本实现同等智能水平。报告将工程效率提升归因于三大方向:架构层面的稠密模型与MoE、注意力机制改进;后训练层面的强化学习与模型蒸馏,以及推理基建层面的硬件优化与KV cache(一种缓存机制)效率。新近发布的DeepSeek-V4被视为最新例证。
谁会接招
不过,摩根士丹利还是大幅上调中国两大前沿AI公司目标价,其中,MiniMax目标价由990港元上调至1100港元,行业评级维持“In-Line”,并明确预期,MiniMax在M3模型升级后将启动重大价格上调,这或成为下一阶段ARR(会计收益率)催化剂。
从企业层面看,DeepSeek的降价暂时没有等来同行跟进。
4月28日,北京商报记者就会否跟进降价,采访了智谱、MiniMax、百度智能云、阿里云、腾讯云,截至发稿,以上几家公司相关人士均未回应。
楚清从技术层面解释了这种分化的原因:“其他公司如果没有和国产算力提前优化适配的话,短期内成本降不下来。”
文渊智库创始人王超的判断更聚焦于价格本身的长期趋势:“Token降价是技术的进步,否则不可能实现。最近不管是算力、Token、芯片还是内存的价格都在上涨,处在一个小周期上涨的阶段,但大周期肯定是要下降的。”
作为智能体赛道的一员,猎豹移动董事长兼CEO傅盛更关注另一条路径的可能性。
他在试用V4系列模型后认为,“V4把国产AI大模型,无论开源还是闭源的性能又提高到一个更高的水平,直逼全球最强模型。虽然还有3―6个月差距,但已经足够好用了。更重要的是DeepSeek可能正在引领国产AI走出一条和美国AI不同的道路”。
这些判断并不矛盾,DeepSeek用技术降本验证大周期下降的方向,而智谱、MiniMax们在用涨价对冲小周期上涨的压力,但从业者都明白核心护城河一定不只是价格这一单一要素,DeepSeek已经给出了它的答案,但行业还在沉默中等待更多人表态。
记者 魏蔚
记者从中国科学院金属研究所获悉,该所沈阳材料科学国家研究中心胡卫进研究员与合作者,提出利用缓冲层定量调控薄膜应变,延迟铁电薄膜晶格弛豫从而增强铁电极化强度的策略,成功揭示极化强度同铁电 未来的足球场,人工智能(AI)当“大脑”?《自然·通讯》19日发表一项来自谷歌深度思维的最新成果,研究团队报告了一个名为“TacticAI”的系统,能在足球比赛中预测角球结果并提供实际且准确的战 据法新社巴黎3月15日报道,15日发布的一项新的重要分析称,影响神经系统的疾病——如中风、偏头痛和痴呆症——已经超过心脏病,成为全球范围内导致人们健康损害的主要原因。 据埃菲社报道,多发性骨髓瘤是成年人中继淋巴瘤之后第二常见的血液肿瘤。最近,西班牙的一个科研团队开发出了一种新的免疫疗法来对抗它。实验室实验表明,这种新疗法比目前优先使用的免疫疗法更有 记者3月21日获悉,全球植物科学期刊《分子植物》刊载了中国科学家的最新研究,中国农业科学院作物科学研究所、国家南繁研究院与阿里达摩院(湖畔实验室)联合研发出全流程智慧育种平台,实现了育种数 一加Ace 3V刚发布,就被红米砍了一刀!随着昨天一加Ace 3V的发布,新一轮中端机的内卷终于拉开了序幕。 而且这电话售价居然还不增反降,直接1999起步。 先来回顾下它的配置,外观相比上一代有所变化,依旧是 。本文链接:新一轮Token价格战打什么http://www.sushuapos.com/show-2-16124-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
上一篇: 机器人的北京故事