设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

DeepSeek成功的底层逻辑及产业影响

发布时间: 来源: 新华网

仿佛是一夜之间,DeepSeek迎来了“滔天的流量”。它不仅在全球引发了新一轮的AI应用热潮,而且给全球的算力资本市场带来了重大冲击。究其原因,DeepSeek不仅在训练成本及使用成本、模型训练及优化方式等领域实现了大量的工程创新,而且打破了AI领域许多的传统叙事逻辑。简而言之,DeepSeek正在改变游戏规则。GUo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek最新推理模型R1的横空出世,带来了一个非常大的惊喜,仅用6天就发展了1亿用户。“用好奇心来揭开AGI的神秘面纱”这一愿景,更增添了神秘色彩。那么,DeepSeek在技术上究竟有哪些创新,成功的背后有哪些深层次的原因?这一切将对中美下一个十年的科技竞争产生哪些影响?GUo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

工程创新GUo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

成就与众不同GUo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek不仅引发了全球新一轮的AI应用热潮,而且对全球的算力资本市场产生重大冲击。究其原因,DeepSeek在训练成本及使用成本、模型训练及优化方式方面均实现了大量工程创新。GUo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

成本是最大的亮点。DeepSeek-R1的整体训练成本比OpenAI少了一个数量级以上。R1在整个训练过程中的工程优化和创新亮点非常多,包括“Multi-Head Latent Attention——多头隐形注意力机制”“Multi-token predication——多token预测”“有选择性地使用8个浮点数精度FP8来替代FP16甚至FP31”等。这些优化其实都不容易实现。每一个看似不显著的优化,在层级叠加效应下却产生了非常惊人的效果。GUo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek其实一共发布了两个模型,分别是R1和R1-zero。DeepSeek基于V3这个基础模型聚焦强化学习获得了R1-zero。但是,R1-zero在回答一些问题的时候容易产生包括“多语言混杂”在内的诸多问题。Deep-Seek又对这个模型进行了SFT(监督微调优化),从而产生了R1。R1的强化学习功能可以实现自动化,是比较容易去scale的。这样一来,该模型未来的想象空间接近无限。GUo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

颠覆性改变GUo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

打破传统叙事逻辑GUo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek之所以备受关注,本质在于打破了很多AI领域的传统叙事逻辑,例如OpenAI对于推理模型的算力堆叠霸权逻辑、AI应用圈的OpenAI寡头垄断格局逻辑、美国对中国的高制程芯片封锁逻辑以及AI大模型的开源闭源逻辑……GUo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

首先,AI圈公认这种推理模型的实现难度是极大的。此前,比较好的推理模型只有OpenAI的GPT o1。Anthropic做不出来,Google“卡”了很久才推出表现一般的Germini 2.0。DeepSeek-R1至少是o1的平替,甚至部分能力还要强于o1。进一步来看,R1不仅免费还开源,训练成本和使用成本均实现了指数级下降。原先o1凭借领先性可以“收割”相当长一段时间的价值,但DeepSeek-R1的出现以及开源的举措,让绝大多数开发者以及聚焦应用的创业公司都能够以更低的门槛去做开发。更加便宜且更容易私有化部署的R1,击碎了华尔街对于所有大模型公司的估值逻辑。GUo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

其次,DeepSeek的出现打破了AI应用圈原有的竞争枷锁。就算是美国的顶尖应用公司选择DeepSeek和ChatGPT时,答案也很清楚。Cursor、Perplexity这些AI领域的超级明星应用,都第一时间进行了DeepSeek模型的部署,而且设置了推荐第一优先级。此外,Google、Amazon、NV等平台也都部署了Deep-Seek模型。这些改变,同步影响了云服务的市场格局。国内大量从事应用开发的企业,在DeepSeek-R1出现之前不得不使用微软云(为了便捷使用GPT-4的API);现在,使用阿里云上部署的Deep-Seek成为可选项。GUo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

再其次,DeepSeek带来了芯片封锁逻辑的崩塌。DeepSeek在辉达CUDA生态的更底层(例如PTX层),通过微调底层代码来优化性能,从而解决“连接通信能力和调度能力被阉割”的问题。专家普遍认为,目前中美AI大模型领域的技术差距约为4个月。从技术能力发展的趋势来看,这一差距继续缩小的概率大于扩大的概率。GUo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

最后,开源让DeepSeek在舆论战中至少“不落下风”。在AGI的道路上做出最强大的模型并开源,应该是OpenAI最早的初心和使命。市场永远不会说谎,谁的模型能力强谁就能掌握最终的话语权。2024年12月DeepSeek V3发布的时候,国际主流媒体主要关注其“成本低廉”;当Deep-Seek-R1发布时,情况则截然不同,因为“滔天的流量”来了。作为一个开源模型,DeepSeek让所有用户在任何领域都增加了一个“顶尖专家”,免费且24小时随时在线。GUo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

仿佛是一夜之间,DeepSeek迎来了“滔天的流量”。它不仅在全球引发了新一轮的AI应用热潮,而且给全球的算力资本市场带来了重大冲击。究其原因,DeepSeek不仅在训练成本及使用成本、模型训练及优化方式等领域实现了大量的工程创新,而且打破了AI领域许多的传统叙事逻辑。简而言之,DeepSeek正在改变游戏规则。GUo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek最新推理模型R1的横空出世,带来了一个非常大的惊喜,仅用6天就发展了1亿用户。“用好奇心来揭开AGI的神秘面纱”这一愿景,更增添了神秘色彩。那么,DeepSeek在技术上究竟有哪些创新,成功的背后有哪些深层次的原因?这一切将对中美下一个十年的科技竞争产生哪些影响?GUo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

工程创新GUo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

成就与众不同GUo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek不仅引发了全球新一轮的AI应用热潮,而且对全球的算力资本市场产生重大冲击。究其原因,DeepSeek在训练成本及使用成本、模型训练及优化方式方面均实现了大量工程创新。GUo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

成本是最大的亮点。DeepSeek-R1的整体训练成本比OpenAI少了一个数量级以上。R1在整个训练过程中的工程优化和创新亮点非常多,包括“Multi-Head Latent Attention——多头隐形注意力机制”“Multi-token predication——多token预测”“有选择性地使用8个浮点数精度FP8来替代FP16甚至FP31”等。这些优化其实都不容易实现。每一个看似不显著的优化,在层级叠加效应下却产生了非常惊人的效果。GUo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek其实一共发布了两个模型,分别是R1和R1-zero。DeepSeek基于V3这个基础模型聚焦强化学习获得了R1-zero。但是,R1-zero在回答一些问题的时候容易产生包括“多语言混杂”在内的诸多问题。Deep-Seek又对这个模型进行了SFT(监督微调优化),从而产生了R1。R1的强化学习功能可以实现自动化,是比较容易去scale的。这样一来,该模型未来的想象空间接近无限。GUo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

颠覆性改变GUo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

打破传统叙事逻辑GUo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek之所以备受关注,本质在于打破了很多AI领域的传统叙事逻辑,例如OpenAI对于推理模型的算力堆叠霸权逻辑、AI应用圈的OpenAI寡头垄断格局逻辑、美国对中国的高制程芯片封锁逻辑以及AI大模型的开源闭源逻辑……GUo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

首先,AI圈公认这种推理模型的实现难度是极大的。此前,比较好的推理模型只有OpenAI的GPT o1。Anthropic做不出来,Google“卡”了很久才推出表现一般的Germini 2.0。DeepSeek-R1至少是o1的平替,甚至部分能力还要强于o1。进一步来看,R1不仅免费还开源,训练成本和使用成本均实现了指数级下降。原先o1凭借领先性可以“收割”相当长一段时间的价值,但DeepSeek-R1的出现以及开源的举措,让绝大多数开发者以及聚焦应用的创业公司都能够以更低的门槛去做开发。更加便宜且更容易私有化部署的R1,击碎了华尔街对于所有大模型公司的估值逻辑。GUo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

其次,DeepSeek的出现打破了AI应用圈原有的竞争枷锁。就算是美国的顶尖应用公司选择DeepSeek和ChatGPT时,答案也很清楚。Cursor、Perplexity这些AI领域的超级明星应用,都第一时间进行了DeepSeek模型的部署,而且设置了推荐第一优先级。此外,Google、Amazon、NV等平台也都部署了Deep-Seek模型。这些改变,同步影响了云服务的市场格局。国内大量从事应用开发的企业,在DeepSeek-R1出现之前不得不使用微软云(为了便捷使用GPT-4的API);现在,使用阿里云上部署的Deep-Seek成为可选项。GUo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

再其次,DeepSeek带来了芯片封锁逻辑的崩塌。DeepSeek在辉达CUDA生态的更底层(例如PTX层),通过微调底层代码来优化性能,从而解决“连接通信能力和调度能力被阉割”的问题。专家普遍认为,目前中美AI大模型领域的技术差距约为4个月。从技术能力发展的趋势来看,这一差距继续缩小的概率大于扩大的概率。GUo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

最后,开源让DeepSeek在舆论战中至少“不落下风”。在AGI的道路上做出最强大的模型并开源,应该是OpenAI最早的初心和使命。市场永远不会说谎,谁的模型能力强谁就能掌握最终的话语权。2024年12月DeepSeek V3发布的时候,国际主流媒体主要关注其“成本低廉”;当Deep-Seek-R1发布时,情况则截然不同,因为“滔天的流量”来了。作为一个开源模型,DeepSeek让所有用户在任何领域都增加了一个“顶尖专家”,免费且24小时随时在线。GUo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

3月18日是第24个“全国爱肝日”。今年活动的主题是,“早防早筛,远离肝硬化”。重庆多所医院开展义诊咨询活动,通过普及肝病的防治知识,让民众主动筛查、规范治疗、定期随访,提高大众爱肝护肝意识, 未来的足球场,人工智能(AI)当“大脑”?《自然·通讯》19日发表一项来自谷歌深度思维的最新成果,研究团队报告了一个名为“TacticAI”的系统,能在足球比赛中预测角球结果并提供实际且准确的战 据法新社3月18日报道,周一,美国半导体巨头英伟达公司发布了其最新型号的电子芯片,这些芯片旨在支持人工智能(AI)革命,英伟达正努力巩固其作为人工智能领域关键供应商的地位。“我们需要更加强大的 21世纪经济报道记者 蔡姝越 上海报道舆论高度关注的游族网络(002174.SZ)投毒案,幕后主使许垚如何量刑有了最新进展。3月22日,上海市第一中级人民法院(以下简称上海一中院)宣判被告人许垚故 21世纪经济报道记者 冯恋阁 王俊 广州、北京报道2013年播出的科幻电视剧《黑镜》第二季中有这样一个故事——女主角玛莎在男友艾什被车祸夺走生命之后,长久无法走出分离的痛苦,最终选 今年3月23日是第64个世界气象日,主题是“气候行动最前线”。面对愈加频繁的极端天气和全球变暖等气候危机,减缓气候变化已刻不容缓。发展新能源是应对气候变化的重要举措之一,而气象服务对于新 。

本文链接:DeepSeek成功的底层逻辑及产业影响http://www.sushuapos.com/show-2-10758-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 中央网信办部署推进2025年信息化重点工作

下一篇: 小心AI伴侣背后的“温柔陷阱”

热门资讯

推荐资讯

  • 甬金股份前董事长虞纪群违规交易股票被警示

      中新经纬3月27日电 甬金股份27日盘后公告,于2026年3月27日收到浙江证监局下发的《浙江证监局关于对虞纪群采取出具警示函措施的决定》([2026]60号)。  浙江证监局指出,

  • 2025年中国新设个体工商户1619.4万户

      中新经纬3月26日电 据国家市场监管总局微信公众号26日消息,近日,国家市场监管总局公布数据显示,2025年全国新设个体工商户1619.4万户,总体发展平稳,为繁荣消费、稳定就业、服

  • 博鳌对话|陈建宇:人形机器人三至五年开始进家庭,价格低于汽车

      中新经纬3月26日电 (薛宇飞 王玉玲)“人形机器人行业的洗牌与整合将逐步发生,资金充裕的头部企业,可能收购聚焦单点技术、细分单品的中小公司,补充技术与业务短板。”  2

  • 刘强东大手笔造游艇,计划投150亿元

      中新经纬3月26日电 据辽宁日报消息,3月25日,大连市政府与深圳市探海游艇产业发展有限公司签署战略合作协议,总投资150亿元的探海游艇制造基地与游艇运营项目正式落户大连。

  • 能源安全,中国悄悄上了分

      中新经纬3月26日电 (薛宇飞)“不稳定,对于稳健的经济而言是最糟糕的情况,能源供应该怎么办?我认为我们刚刚意识到,我们不能依赖石油,不能依赖特定地区的石油,对此必须格外谨慎

  • 原晋能集团副总经理冯培一被提起公诉

      中新经纬3月25日电 “最高人民检察院”微信号25日消息,日前,原晋能集团有限公司副总经理冯培一涉嫌受贿罪、挪用公款罪一案,由山西省监察委员会调查终结,移送检察机关审查起

  • 国家药监局:加快推进从“制妆大国”迈向“制妆强国”

      中新经纬3月25日电 据国家药监局微信号,3月24日至25日,2026年全国化妆品监督管理工作会议召开,总结2025年和“十四五”时期工作,分析当前面临形势,研究部署2026年重点任务。

  • 沪指重上3900点,光通信概念大涨

      中新经纬3月25日电 25日,A股三大指数涨超1%,沪指重上3900点。上证指数涨1.30%,报3931.84点;深证成指涨1.95%,报13801.00点;创业板指涨2.01%,报3316.97点。  Wind截图  盘面

  • 沪指收复3900点!券商:A股仍处牛市,大盘蓝筹有较好安全边际|宅男财经

      【宅男财经|首席面对面】25日,沪指高开后持续拉升,盘中重回3900点,超5000股上涨,玻璃纤维、CPO、高速铜连接等算力硬件题材活跃。  昨日,A股在地缘政治风险缓和预期的背

  • 张雪峰因心源性猝死抢救无效去世

      中新经纬3月24日电 24日晚间,峰学蔚来创始人、教育博主张雪峰微博发布讣告称,张雪峰因心源性猝死全力抢救无效,于2026年3月24日15时50分在苏州逝世。  图源:张雪峰微博 

  • 中国电信2025年净利微增,全年拟派息248.9亿元

      中新经纬3月24日电 24日晚间,中国电信披露《2025年年度报告》称,2025年实现营业收入5239.25亿元,同比增长0.1%;归属于上市公司股东的净利润331.85亿元,同比增长0.5%。  中

  • 多地二手房迎“小阳春”:刚需进场、老破小“真香”

      中新经纬3月24日电 (薛宇飞)“您昨天看的房子,今天卖掉了。”北京工作的郑玫(化名)在看完房子的第二天,房产经纪人就电话告知她,她看中的一套二手房源降价20万元成交了。 

  • 日榜
  • 周榜
  • 月榜