21世纪经济报道记者孔海丽 北京报道
从2024年12月发布V3大模型,到最近推出R1模型和多模态模型Janus-Pro,DeepSeek持续出圈,形成了全球AI界乃至整个科技圈的“DeepSeek现象”。
多次采访马斯克等AI企业家的知名播客主持人莱克斯·弗里德曼(Lex Fridman),用了一个词叫做“DeepSeek 时刻”来描述,“我认为 5年后它仍将作为科技史上的关键事件被人们铭记。”
DeepSeek出圈的原因之一是,它采用“更聪明”的算法,把AI训练成本砍掉近60%,却实现甚至超越了同类模型的性能。简单来说,同样的产品,别人花100块训练一个AI模型,它只要40元。这种“省钱打法”直接戳中了行业的痛点——过去拼的是谁能买更多高价芯片,现在比的是谁能把芯片用得更好。
DeepSeek不仅提供了新的AI技术路线,更重要的是,它在硅谷和华尔街联合主导的全球AI叙事铁墙上撕开了一道口子。
但我们在自豪和兴奋之余,还是要保持清醒的头脑。且不说,在资金、技术、人才等方面,以DeepSeek为代表的新创AI企业,尚无法向OpenAI、Anthropic 这些巨头发起全面挑战,单单就V3、R1而言,其算法优化也有代价:处理复杂场景时,它的表现明显不如烧钱堆出来的大模型。就像用精简版PS软件修图——日常够用,专业场景会露怯。何况,短时间内我们还不足以撼动英伟达巨头们的硬件江湖。
摆脱硬件依赖尚不现实
在“DeepSeek现象”推动下,未来的算力图景,并非单一曲线绘就。
一方面,像DeepSeek这样的产品,更低开发和消费成本、更高流量,可能带来AI应用的突然爆发,这是所有从业人员梦寐以求的场景。
另一方面,当训练成本下降刺激更多公司入场,消费者应用呈指数级增加,催生AI生态链全面繁荣,芯片需求将迎来超乎预期的增长。
硬币两面,恰好构成了算力命题的悖论。
业内人士援引腾讯之前发布的白皮书,AI Agent应用要实现跳跃式增长乃至爆发,必须闯过三关:场景渗透率大于15%、任务完成度大于80%、用户信任度大于60%。
仅以信任度为例,此前Gartner的一项抽样调查显示,64%的人表示,不希望在客户服务中使用人工智能。
目前AI Agent应用的技术能力仅满足简单场景,如客服、日程管理等。而复杂决策如医疗咨询、法律建议等,仍存在难以填补的缺陷。AI最大的应用场景是教育、医疗、金融等,但是,误诊率5%的AI医生看病,依然很难被接受。就好比,无人驾驶比人类更安全,但无人驾驶每出现一次事故都会被凝视被放大。人类对AI的信任,只是处于初始水平,此外还面临着各国隐私保护法规、用户习惯、能源约束、技术路线分歧、多智能体协作、伦理困境等方面的挑战。
业内此前预计,要到2026年前后,才将出现AI信任度的分水岭(大于60%)。“DeepSeek现象”会不会加快这个时间表的到来?现在没有人能够断定。
有人说,2025年将是AI Agent应用元年。而DeepSeek通过异构计算架构、CPU+FPGA+ASIC混合部署和动态负载均衡算法等创新,将单位算力产出提升2倍多,这是否意味着它探索的技术方向将打破算力垄断,导致算力过剩?
这关系到算力现状。其特点是严重不均衡。一是地区不均衡。北美尤其是美国占据了全球算力规模最大份额,其次是中国,但高性能算力基本集中在北美。同一经济体内也存在区域不平衡。
二是供应不均衡。GPU厂商主要是英伟达,2025年其GPU销量预计可达700万块;CPU厂商主要是英特尔、AMD;BSIC芯片的主要厂商是博通和Marvell,合计占有超60%的份额;云计算方面,谷歌、微软、亚马逊占据全球65%的市场份额。这就是大家所说的算力垄断。
三是企业不均衡。高端芯片方面,微软、Meta、谷歌、亚马逊、xAI几大巨头目前囤积的算力总共约合355万块等效H100,这还不包括AI新贵OpenAI在内。其他经济体企业能拿到的高端芯片量,无法与之相比。
算力供需还存在结构性错配的问题。从纵向看,随着多模态应用的普及,推理侧的算力需求增速已经超过训练侧,但算力还主要布局于训练侧,调整需要一点时间;从横向看,大量算力被消耗在数据清洗和模型调试等非核心环节。
以大模型算力为例。2024年下半年以来,大模型算力已经从训练向推理转移,其中占据推理算力市场最大份额的,仍然是英伟达。
《中国算力发展报告(2024)》援引援引IDC报告,截至2023年四季度,英伟达GPU全球市场份额达95.9%,英特尔和AMD在CPU市场合计占比89.2%。英伟达通过在CUDA和GPU两端同时发力,构筑了软硬协同的护城河。有人说DeepSeek通过架构革新,绕开了CUDA,冲破了它的护城河,这其实是误读。多位专家研读DeepSeek公开(开源))论文后表示,V3、R1的底层架构仍然是基于CUDA生态建构。
在这种市场格局下,其他区域及其厂商要发起挑战,试图打破巨头垄断,摆脱以英伟达为代表的算力依赖,更多是乐观主义的展望式预期。除非量子芯片实现规模化商用,但那是5年甚至10年以后的事。
至于算力过剩,短期内不存在,整体上仍然是供大于求。《中国算力发展报告(2024)》援引中国信通院数据,截至2023年底,全球算力规模同比增长40%,但以CPU为代表但芯片年性能提升不足15%,无法满足视频、图片等非结构化数据的处理需求。赛迪智库2024年初测算,2023年中国智能算力需求达123.6EFLOPS,但智能算力供给规模仅为57.9EFLOPS,严重供不应求。“DeepSeek现象”目前看来是增加了而不是减少了硬件需求。比如,32G的英伟达RTX50系显卡,近半个月涨势凶猛,最高已经炒到了6万元以上。其中部分原因在于,不少消费者购入RTX50显卡去做DeepSeek V3、R1本地化部署。
AI巨头为何焦虑
既然DeepSeek尚未突破硬件限制,所做的也是巨人肩上的创新,但为什么还是引起美国AI巨头的焦虑甚至恐慌?
从表层看,美国AI巨头嗅到了危机,不是因为技术被超越,而是实现目标的技术路径变了,新创企业有了更多选择。就像燃油车时代比拼的是发动机,电动车时代比拼的是电池管理技术。DeepSeek证明了硅谷堆硬件堆数据的路线不是唯一选择,高效用好现有资源同样能打。
DeepSeek省钱省力的R1模型发布时,刚好是OpenAI、甲骨文、英伟达等科技巨头宣布5000亿美元算力基建——星际之门计划的时间段,放在这个背景下对比来看,美国AI巨头的刺痛感就更强烈了。
一位资深AI观察人士告诉21世纪经济报道记者,DeepSeek发起的这场“效率革命”,是AI发展从技术理想主义转向工程实用主义的标志性事件。它证明了,在现有硬件和物理约束条件下,通过计算拓扑结构优化获得的边际收益,远高于单纯增加芯片数量的线性增长。
这解释了为何美国AI巨头会产生战略焦虑的深层因素——当工程创新能力开始在AI竞争中脱颖而出,硅谷长期主导的技术先发优势就面临重估,而且它也将带来AI叙事的重估,背后是资本和资本市场的重估。
宏观趋势研究学者、经济学家David Woo近日接受访谈时表示,过去两年,人们一直在谈论美国经济的“例外主义”,而AI是推动这一论断形成的重要因素。美股市值占全球资本市场的份额达63%,其中ChatGPT出现后的两年,就增加了10个百分点,而七大科技巨头又占美股市值的25%。这些巨头正是依靠AI技术的强大优势巩固了它们的地位,从而间接巩固了美国资本市场的优势地位。
因此,AI与美国科技巨头、资本市场其实是捆绑在一起的,也正是硅谷和华尔街联合主导了全球AI叙事。
如今,来自东方的神秘力量DeepSeek向这套AI叙事发起了冲锋。全球科技和资本领域持续10多天的热烈反应,可以从侧面解释科技巨头的焦虑和资本市场为何如此紧张。截至2月3日美股盘前,英伟达股价自1月24日以来已跌去20%。当然,这不排除是投资者市场(避险)情绪的短期波动。
前述资深AI观察人士认为,DeepSeek创造的历史性价值有两点:一是力行开源,本质上是人类资源、科技创新的共享表达;二是提供了碓砌算力和数据之外的新的技术路径。记者这几天的采访发现,DeepSeek以上两点贡献,基本已成为业内的共识。
在现实层面,DeepSeek也揭示了一个残酷的真相:当创新进入深水区,工程能力比学术突破更重要,成本控制比参数竞赛更致命,社会接受度比算法精度更关键。
如果跳开地缘政治谁赢谁输的问题,仅仅着眼于行业本身,商业本质在于,赚钱的公司才能活下去。当资本泡沫退去,或许我们会发现,技术强大固然重要,但应用和生存才是企业当下的现实,也是所有AI新创企业的必答题。
从 “谁能烧钱造最大模型”,过渡到“谁能用最少钱办最多事” ;美国企业依然掌握着最先进的芯片,但中国企业找到了更省钱的玩法——这才是DeepSeek重新书写的AI叙事。
毕竟,不是所有新创企业都像OpenAI、xAI动不动就能融资到60亿美元。正是在这个意义上,DeepSeek的技术路线,受到全球大批AI企业的效仿,其开源策略受到全球研究机构的称赞,其价格策略引发全球消费者的热捧。
高效率低成本的技术创新,加上全球关注的巨大流量,让DeepSeek赢得了宝贵的时间窗口。这是堆积大量美元都难以买到的,也是OpenAI、Anthropic等AI新创企业羡慕甚至嫉妒的。
今年全国两会期间,人工智能成为热点话题,“人工智能+”首次被写入政府工作报告。一头连着数字经济发展大局,一头连着行业变革与创新,“人工智能+”既是新质生产力发展的“新引擎”,也是产业和消费 3月21日是世界睡眠日,中国主题为“健康睡眠 人人共享”。近日发布的《2023年中国居民睡眠白皮书》显示,我国居民平均睡眠时长6.75小时,平均在零点后入睡,夜间睡眠时长普遍偏短。你是否有睡眠困扰 美国加州理工学院喷气推进实验室的一个机器人专家团队,与卡内基梅隆大学机器人研究所科学家合作,开发出一种蛇形机器人,用于调查土星第六大卫星土卫二的地形,以寻找生命的“蛛丝马迹”。相关研究 21世纪经济报道记者 冯恋阁 王俊 广州、北京报道2013年播出的科幻电视剧《黑镜》第二季中有这样一个故事——女主角玛莎在男友艾什被车祸夺走生命之后,长久无法走出分离的痛苦,最终选 30台发动机助进阶版“鹊桥”升空 中新社西安3月20日电 (记者 张一辰)3月20日8时31分,长征八号遥三运载火箭在中国文昌航天发射场顺利升空,成功将“鹊桥二号”卫星送入预定轨道。作为公共中继星平台,“鹊桥二号” 记者3月22日获悉,中山大学、深圳华大生命科学研究院与复旦大学的研究团队合作,揭示了多种蚊虫在不同生境下病毒的多样性、传播分布的影响因素及地理谱系特征,在多维尺度上为研究蚊虫病毒组提供 。本文链接:深度|DeepSeek现象背后:算法弈局与巨头焦虑http://www.sushuapos.com/show-2-10418-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
上一篇: DeepSeek压力下奥特曼承认:OpenAI闭源策略站在了历史的错误一边
下一篇: 驯化微生物 “吃掉”硫化物