21世纪经济报道记者 袁思杰 香港报道
春节期间,一场“中国AI地震”席卷全球科技圈。
DeepSeek发布的全新人工智能模型 R1,引发了全球范围内的关注和讨论。作为一款主打低成本、高效率的AI语言模型,R1的性能在某些垂直领域已接近甚至媲美OpenAI的ChatGPT-4。更令人瞩目的是,DeepSeek宣称其模型训练成本仅为同类大模型的1/10。
R1发布后,美国科技股大幅波动:英伟达股价暴跌近17%,单日市值蒸发高达5888亿美元,创下美股史上单日市值蒸发新纪录。“木头姐”凯西·伍德也在公开访谈中坦言:“DeepSeek的低成本模式可能颠覆硅谷的算力霸权逻辑。”
同时,DeepSeek已展现出商业化势能:上线18天全球下载量突破1600万次,日活用户超2000万,推动亚马逊Bedrock、微软Azure和华为昇腾云争相接入其模型服务。
DeepSeek是怎样在算力不足的情况下实现低成本训练的?开源大模型的模式是否可以打破巨头垄断?低成本训练反而会引起算力需求激增吗?哪种AI商业化路径更具长期竞争力?AI浪潮下普通人如何自我提升?
围绕这些问题,三七二十一节目邀请到了豆神集团副总裁兼任CTO阎鹏、快思慢想研究院院长和原商汤智能产业研究院创始院长田丰,以及知名科技博主(海宁科技观)陈海宁,共同探讨这些话题!
Show Notes:
03:50 DeepSeek通过架构创新实现低成本训练
04:28 强化学习比重提升使DeepSeek大模型更强大
07:50 2025年是AI大模型的“成本年”
09:20 中国AI技术社区的发展需建立本土技术站
10:00 DeepSeek的成功让资本重新重视开源模型的潜力
12:03 开源模型在企业应用中有技术门槛
14:04 DeepSeek坚持开源策略旨在建立中国AGI技术社区和创新技术站、减少对美国的依赖
16:38 AI大模型开源的好处在于共享成果和共建提升
21:55 随着算力需求持续增长和成本降低,大模型应用和服务普及是必然过程
23:02 AI发展对算力需求只会加速
24:10 “DeepSeek时刻”让AI迈向通用化技术时代
25:52 “成本拐点”:市场规模和产品成本成反比
29:25 AI浪潮已改变普通人的工作和生活
30:30 应尽早使用AI工具提高效率,同时提高数字化教育程度
33:17 AI普及将如智能手机般融入生活,带来商业机会
37:56 进行AI技能学习,建议打基础、学习思维方法以应对AI浪潮
43:31 教育和医疗可能成为AI应用最早爆发领域,服务业可实现规模化和高质量发展
48:03 AI将在互联网、软件、服务业和硬件四方向推进商业化,科研是关键
据英国《金融时报》网站3月13日报道,科学家们已经在利用人工智能(AI)阐释人体所谓的“黑暗基因组”,并开发一种可能很强大的癌症检测、监测和治疗新方法。美国约翰斯·霍普金斯大学的研 那些在吃完一顿饱饭后不久就在冰箱里翻找零食的人,可能不是胃口好,而是因为寻找食物的神经元过度活跃的缘故。美国加州大学洛杉矶分校心理学家在老鼠大脑中发现了一个回路:即使它们不饿,也会让它 美国加州理工学院喷气推进实验室的一个机器人专家团队,与卡内基梅隆大学机器人研究所科学家合作,开发出一种蛇形机器人,用于调查土星第六大卫星土卫二的地形,以寻找生命的“蛛丝马迹”。相关研究 3月22日消息,一加Ace 3V昨晚发布,起售价1999元,将于3月25日正式发售。现在这款新机已经来到我们评测室,下面为大家带来图赏。一加Ace 3V全球首发第三代骁龙7+移动平台,采用骁龙8 Gen3相同的4nm制程工 随着量子技术的发展,利用量子特性突破传统测量技术极限的新一代精密测量技术——量子测量开始得到应用。记者从中国计量科学研究院获悉,由该院牵头编制的《量子测量术语》《量子精密 3月21日,人工智能大模型赋能企业科技创新研讨会在广州召开。中国知网在会议期间发布了专利大数据智能应用产品“AI Pat+”。据中国知网相关负责人介绍,中国知网在人工智能大模型领域的深入研发 。本文链接:三七二十一|中国AI的“斯普特尼克时刻”:DeepSeek的崛起与启示http://www.sushuapos.com/show-2-10918-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
上一篇: 外卖骑手上社保:“我可以干到退休了!”