设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

创大模型价格新低!DeepSeek API输入缓存降至首发价十分之一

发布时间: 来源: 界面新闻

DeepSeek正在重新定义大模型普惠的边界。QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

4月26日,DeepSeek官方发布API价格调整公告,全系API输入缓存命中价格降至首发价的十分之一,V4‑Pro更叠加限时2.5折,百万Tokens输入缓存命中低至0.025元,创全球大模型价格新低。QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

根据DeepSeek官方API定价页面公示,本次降价覆盖V4系列全模型,核心调整集中在输入缓存命中场景。其中DeepSeek-V4-Flash输入缓存命中价格从0.2元/百万Tokens降至0.02元/百万Tokens。QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

面向企业级用户的DeepSeek-V4-Pro优惠力度更大,原价1元/百万Tokens的缓存输入降至0.1元,2026年5月5日前叠加2.5折限时特惠,实际仅0.025元/百万Tokens,缓存未命中输入从12元降至3元,输出从24元降至6元。QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

图片来源:DeepSeek官网QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek方面提及,DeepSeek-Chat与DeepSeek-Reasoner两个模型名将于日后弃用。出于兼容考虑,二者分别对应DeepSeek-V4-Flash的非思考与思考模式。QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

对比调价前后不难发现,高频调用、长文本处理场景成本降幅超90%,RAG知识库、智能客服、文档分析等缓存命中率高的应用,可直接实现商用成本断崖式下跌,有助于打破AI规模化落地的成本枷锁。QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek大幅降价背后,与DeepSeek‑V4的技术升级以及和昇腾生态的深度协同有关。QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

4月24日,DeepSeek‑V4预览版正式发布,同步开源Pro与Flash两款模型,均支持100万token超长上下文,自研稀疏注意力架构让推理算力消耗大幅降低,Pro版单token算力仅为V3.2的27%,KV缓存降至10%,从底层实现成本优化。QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek方面公布的参数显示,DeepSeek‑V4‑Pro激活参数49B、预训练数据33T,定位高性能旗舰;DeepSeek‑V4‑Flash激活参数13B、预训练数据32T,主打高速与低成本。QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

与前代模型比较,DeepSeek-V4-Pro的Agent能力显著增强。在Agentic Coding评测中,V4-Pro已达到当前开源模型最佳水平,并在其他Agent相关评测中同样表现优异。据悉,目前DeepSeek-V4已成为DeepSeek内部员工使用的 Agentic Coding模型,据评测反馈使用体验优于Sonnet 4.5,交付质量接近Claude Opus 4.6非思考模式,但仍与Opus 4.6思考模式存在一定差距。QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在世界知识测评中,DeepSeek-V4-Pro大幅领先其他开源模型,稍逊于顶尖闭源模型Gemini-Pro-3.1。而在数学、STEM、竞赛型代码的测评中,DeepSeek-V4-Pro超越当前所有已公开评测的开源模型,比肩世界顶级闭源模型。QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

相比DeepSeek-V4-Pro,DeepSeek-V4-Flash在世界知识储备方面稍逊一筹,但展现出了接近的推理能力。而由于模型参数和激活更小,相较之下V4-Flash能够提供更加快捷、经济的API服务。QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek-V4还开创了一种新的注意力机制,在token维度进行压缩,结合DSA稀疏注意力(DeepSeek Sparse Attention),实现了全球领先的长上下文能力,并且相比于传统方法大幅降低了对计算和显存的需求。QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

更值得关注的是,昇腾超节点全系列产品支持DeepSeek V4系列模型。这也意味着,DeepSeek释放了更多国产化信号。QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek-V4在一份技术报告中提及,“在英伟达GPU和华为昇腾NPU两个平台上验证了细粒度EP(专家并行)方案,与强力的非融合(non-fused)基线相比,该方案在通用推理任务中实现了1.50-1.73倍加速;在对延迟敏感的场景(例如强化学习(RL)rollout 和高速 Agent 服务)中,最高可达1.96倍加速。”QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek强调,随着下半年昇腾超节点全系列产品批量上市,Pro版价格有望大幅下调。QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek-V4发布后,高盛发布分析报告指出,DeepSeek V4的核心意义在于以更低成本支持更复杂的智能体应用落地,从而打开AI应用规模化的新空间。对于纳入昇腾超节点,高盛认为DeepSeek的成本竞争力将进一步强化,为更广泛的应用落地创造条件。此外,在芯片持续收紧的背景下,中国顶尖AI模型向国产算力迁移的趋势得到头部玩家的明确背书。QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

高盛报告还援引新闻报道称,腾讯和阿里正在洽谈以逾200亿美元估值投资DeepSeek,而智谱和MiniMax的最新市值分别约为530亿美元和310亿美元,这一潜在交易折射出巨头对稀缺顶层AI能力的争夺逻辑。QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而华泰证券认为,市场容易将V4理解为“降本压低算力、存储需求”,但更重要的边际变化在于长上下文成本下降后,复杂Agent、多文档分析、长周期任务、在线学习等场景可用性提升,推理调用量与存储访问频次有望扩张。QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek正在重新定义大模型普惠的边界。QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

4月26日,DeepSeek官方发布API价格调整公告,全系API输入缓存命中价格降至首发价的十分之一,V4‑Pro更叠加限时2.5折,百万Tokens输入缓存命中低至0.025元,创全球大模型价格新低。QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

根据DeepSeek官方API定价页面公示,本次降价覆盖V4系列全模型,核心调整集中在输入缓存命中场景。其中DeepSeek-V4-Flash输入缓存命中价格从0.2元/百万Tokens降至0.02元/百万Tokens。QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

面向企业级用户的DeepSeek-V4-Pro优惠力度更大,原价1元/百万Tokens的缓存输入降至0.1元,2026年5月5日前叠加2.5折限时特惠,实际仅0.025元/百万Tokens,缓存未命中输入从12元降至3元,输出从24元降至6元。QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

图片来源:DeepSeek官网QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek方面提及,DeepSeek-Chat与DeepSeek-Reasoner两个模型名将于日后弃用。出于兼容考虑,二者分别对应DeepSeek-V4-Flash的非思考与思考模式。QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

对比调价前后不难发现,高频调用、长文本处理场景成本降幅超90%,RAG知识库、智能客服、文档分析等缓存命中率高的应用,可直接实现商用成本断崖式下跌,有助于打破AI规模化落地的成本枷锁。QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek大幅降价背后,与DeepSeek‑V4的技术升级以及和昇腾生态的深度协同有关。QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

4月24日,DeepSeek‑V4预览版正式发布,同步开源Pro与Flash两款模型,均支持100万token超长上下文,自研稀疏注意力架构让推理算力消耗大幅降低,Pro版单token算力仅为V3.2的27%,KV缓存降至10%,从底层实现成本优化。QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek方面公布的参数显示,DeepSeek‑V4‑Pro激活参数49B、预训练数据33T,定位高性能旗舰;DeepSeek‑V4‑Flash激活参数13B、预训练数据32T,主打高速与低成本。QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

与前代模型比较,DeepSeek-V4-Pro的Agent能力显著增强。在Agentic Coding评测中,V4-Pro已达到当前开源模型最佳水平,并在其他Agent相关评测中同样表现优异。据悉,目前DeepSeek-V4已成为DeepSeek内部员工使用的 Agentic Coding模型,据评测反馈使用体验优于Sonnet 4.5,交付质量接近Claude Opus 4.6非思考模式,但仍与Opus 4.6思考模式存在一定差距。QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在世界知识测评中,DeepSeek-V4-Pro大幅领先其他开源模型,稍逊于顶尖闭源模型Gemini-Pro-3.1。而在数学、STEM、竞赛型代码的测评中,DeepSeek-V4-Pro超越当前所有已公开评测的开源模型,比肩世界顶级闭源模型。QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

相比DeepSeek-V4-Pro,DeepSeek-V4-Flash在世界知识储备方面稍逊一筹,但展现出了接近的推理能力。而由于模型参数和激活更小,相较之下V4-Flash能够提供更加快捷、经济的API服务。QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek-V4还开创了一种新的注意力机制,在token维度进行压缩,结合DSA稀疏注意力(DeepSeek Sparse Attention),实现了全球领先的长上下文能力,并且相比于传统方法大幅降低了对计算和显存的需求。QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

更值得关注的是,昇腾超节点全系列产品支持DeepSeek V4系列模型。这也意味着,DeepSeek释放了更多国产化信号。QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek-V4在一份技术报告中提及,“在英伟达GPU和华为昇腾NPU两个平台上验证了细粒度EP(专家并行)方案,与强力的非融合(non-fused)基线相比,该方案在通用推理任务中实现了1.50-1.73倍加速;在对延迟敏感的场景(例如强化学习(RL)rollout 和高速 Agent 服务)中,最高可达1.96倍加速。”QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek强调,随着下半年昇腾超节点全系列产品批量上市,Pro版价格有望大幅下调。QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek-V4发布后,高盛发布分析报告指出,DeepSeek V4的核心意义在于以更低成本支持更复杂的智能体应用落地,从而打开AI应用规模化的新空间。对于纳入昇腾超节点,高盛认为DeepSeek的成本竞争力将进一步强化,为更广泛的应用落地创造条件。此外,在芯片持续收紧的背景下,中国顶尖AI模型向国产算力迁移的趋势得到头部玩家的明确背书。QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

高盛报告还援引新闻报道称,腾讯和阿里正在洽谈以逾200亿美元估值投资DeepSeek,而智谱和MiniMax的最新市值分别约为530亿美元和310亿美元,这一潜在交易折射出巨头对稀缺顶层AI能力的争夺逻辑。QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而华泰证券认为,市场容易将V4理解为“降本压低算力、存储需求”,但更重要的边际变化在于长上下文成本下降后,复杂Agent、多文档分析、长周期任务、在线学习等场景可用性提升,推理调用量与存储访问频次有望扩张。QpD速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

日前,盛世盈创氢能科技(陕西)有限公司(以下简称盛世盈创)与协氢(上海)新能源科技有限公司宣布达成战略合作,共同推进风冷氢燃料电池电堆全自动化生产线(以下简称风冷堆)的研发与生产。双方协议,将建设目 日本《朝日新闻》近日发表题为《深海之光——极端环境是创意宝库》的文章,作者是樱井林太郎,编译如下:在被称为最后未开垦地的深海,有着低温、高压、黑暗等极限环境。能否从这些极限环 据英国《自然》杂志网站19日报道,美国华盛顿大学科学家首次使用生成式人工智能(AI)工具,帮助他们制造全新抗体。研究团队表示,AI设计抗体或能更好靶向一些很难被攻击的药物标靶,但这些抗体距离临床 近日,我国“主要作物丰产增效科技创新工程”重点专项“优质双季超级稻丰产增效技术研发与集成示范”项目,在湖南岳阳宣布启动。据了解,该项目主要聚焦优质双季超级稻丰产增效技术研发,着力探明双 3月22日,中国互联网络信息中心(CNNIC)发布第53次《中国互联网络发展状况统计报告》(以下简称《报告》)。《报告》显示,截至2023年12月,我国网民规模达10.92亿人,较2022年12月新增网民2480万人,互联网 3月24日,记者从中国农业科学院获悉,该院蔬菜花卉研究所甘蓝类蔬菜遗传育种创新团队,开发了快速创制细胞质雄性不育系的新方法——“一步法”。相关研究日前发表在国际期刊《自然&midd 。

本文链接:创大模型价格新低!DeepSeek API输入缓存降至首发价十分之一http://www.sushuapos.com/show-2-16098-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: AI与科学仪器融合已到关键节点

下一篇: 北京车展首个观众日 一大拨“黑科技”轮番登场

热门资讯

  • 海龟深潜时一分钟心跳只有两次

    据《日本经济新闻》3月19日报道,东京大学副教授坂本健太郎等人研究发现,海龟下潜时心率将急剧下降。海龟与鲸等哺乳类动物同样,心率随下潜深度加深而

  • 新疗法可有效治疗多发性骨髓瘤

    据埃菲社报道,多发性骨髓瘤是成年人中继淋巴瘤之后第二常见的血液肿瘤。最近,西班牙的一个科研团队开发出了一种新的免疫疗法来对抗它。实验室实验表

  • “95后”的无人机“造像师”

    “当时是怎样选中低空经济这个领域,并且来深圳发展的?”面对这个关乎事业发展的问题,“95后”台青张晏纶坦言,“这是一场面试带来的惊喜。”张晏纶来自

  • 来看金星土星“亲密一刻”

    3月22日黎明,太阳系中最明亮的行星金星与太阳系中拥有最多卫星的行星土星将在东南方低空近距离相伴,上演“结伴游”。北京星空摄影爱好者王俊峰2023

  • 肠道菌群关键代谢物可增强抗癌药疗效

    记者3月17日从浙江大学获悉,该校医学院附属第二医院王良静教授团队、附属邵逸夫医院陈淑洁主任医师团队联合研究发现,一种肠道菌群产生的小分子代谢

  • 雌蛙会向雄蛙“暗送秋波”?这项研究给出了答案

    记者3月21日从安徽师范大学获悉,该校生命科学学院张方教授课题组通过野外自然抱对、控制实验下抱对以及视频回放等实验手段,证实他们前期提出的,眨眼

  • 银鲳高质量染色体水平 参考基因组发布

    3月19日,记者从中国科学院海洋研究所了解到,该所研究团队在国际上首次发布了银鲳的高质量染色体水平参考基因组。相关研究论文近日在线发表于《自然

  • 云海二号02组卫星发射成功

    记者从中国航天科技集团获悉,3月21日13时27分,长征二号丁运载火箭/远征三号上面级在酒泉卫星发射中心起飞,随后将云海二号02组卫星送入预定轨道,发射任

  • 小龙虾能将锂离子转入食物链

    从手机到手表再到电动汽车,锂离子充电电池为众多设备提供动力。但随着消费者丢弃电子产品的增加,越来越多的锂可能会进入环境。研究人员在美国化学会

  • huaweiMate 70细节曝光!芯片性能比肩5.5nm、新鸿蒙5.0系统

    3月24日消息,今天数码博主“厂长是关同学”曝光了huaweiMate 70系列电话的部分配置信息。该博主表示,huawei全新的Mate 70系列首发会搭载新的芯片,芯片的

  • 英国2026年试飞电动“飞的”

    据英国《每日电讯报》网站3月18日报道,根据英国政府的新航空计划,首批电动飞行出租车将于2026年试飞。周一发布的《“飞行未来”行动计划》为飞行出

  • “捕风捉光”,气象服务助力新能源发电

    今年3月23日是第64个世界气象日,主题是“气候行动最前线”。面对愈加频繁的极端天气和全球变暖等气候危机,减缓气候变化已刻不容缓。发展新能源是应

推荐资讯

  • 日榜
  • 周榜
  • 月榜