1月27日,被称为“东方神秘力量”的DeepSeek,在资本市场掀起了滔天巨浪。
由于DeepSeek通过结构化稀疏注意力、混合专家系统、动态计算路由等技术,显著降低了模型训练和推理的算力消耗,由此引发了市场关于算力需求下降的担忧。
受此影响,美股科技巨头股价开盘集体大跌,英伟达跌超10%,市值蒸发超3500亿美元(约合人民币2.5万亿元)。台积电跌超8%、博通跌超11%、光刻机巨头阿斯麦(AMSL)跌超7%,微软、甲骨文、Meta等也纷纷下跌。
美股三大指数齐跌,纳指跌超3%。
近几天,有关DeepSeek最新AI模型的讨论不断升温,这款模型在使用较低性能芯片的情况下表现出较高的性价比,这让像英伟达公司这样主导全球AI股市热潮的企业的高估值合理性受到质疑。英伟达被视为AI技术不可或缺的芯片供应商,股价在周一盘前交易中下跌10%。
明星科技股纷纷闪崩,博通、台积电、阿斯麦股价盘前的跌幅均在10%左右。
不过DeepSeek自己对此却有不同看法,其表示英伟达股价暴跌与它无关。
1月27日,DeepSeek应用登顶苹果中国地区和美国地区应用商店免费App下载排行榜,在美区下载榜上超越了ChatGPT。
苹果美国区应用商店
苹果AppStore中国区免费榜
DeepSeek是啥?
DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。
近日,DeepSeek发布推理模型R1,在性能逼近OpenAI o1正式版的同时,推理成本却仅为后者的几十分之一。
纽约时报称,DeepSeek大模型以极低成本(600万美元)和少量芯片(2000块)实现了与OpenAI等巨头相媲美的性能,挑战了“唯有科技巨头才能研发尖端AI”的行业共识。
低成本实现高性能模型研发,对用户来说体验感也立竿见影——它功能强大,但却免费使用,并且DeepSeek还将代码面向开发者进行了开源。
据了解,DeepSeek R1没有使用业内普遍使用的监督微调(SFT)训练范式,而是直接通过强化学习让模型自主进化出复杂的推理能力,包括反思和长链思考等能力。这种方法不仅提高了训练效率,还减少了对昂贵计算资源的依赖。与OpenAI的o1相比,DeepSeek模型的百万token输入成本从15美元锐减到0.55美元,输出成本则从60美元降低到2美元。
有人提出,DeepSeek恰恰是美国对华进行芯片出口限制之下所激发出的创新。
1月26日,DeepSeek出现了短时闪崩现象。不少网友反映,使用时遇到 “服务器繁忙” 的提示。对此,DeepSeek回应称,当天下午确实出现了局部服务波动,但问题在数分钟内就得到了解决。此次事件可能是由于新模型发布后,用户访问量激增,服务器一时无法满足大量用户的并发需求。
来源:中国基金报(记者:泰勒)、每日经济新闻、证券时报
新快报讯 人间三月,姹紫嫣红,一年中最美丽的节日——第114个“三八”国际妇女节即将来临。3月2日,由东莞市妇联、东莞市委政法委指导,东莞市妇女儿童福利会、麻涌镇妇女联合会协办,广东嘉荣超市有限公司、金佰利(中国)有限公 国务院总理李强3月5日在政府工作报告中介绍今年政府工作任务时提出:坚持不懈抓好“三农”工作,扎实推进乡村全面振兴。锚定建设农业强国目标,学习运用“千村示范、万村整治”工程经验,因地制宜、分类施策,循序渐进、久久为 岁月不居,天道酬勤在这个万物生长繁花似锦的季节我们凝心致远,聚力前行为2023年的奋斗划上圆满的句号回顾过去一年的发展轨迹,复盘一步一个脚印的深耕细作。3月1日下午,以“跨越百亿,全亿有我”为主题的全 张玉卓 国务院国资委主任 5日的十四届全国人大二次会议首场“部长通道”上,国务院国有资产监督管理委员会主任张玉卓介绍说,今年《政府工作报告》对国资国企方面安排部署内容比较丰富,包括国有企业深化改革,国有 21世纪经济报道记者 朱丽娜 李金萍 香港报道“作为港区全国政协委员,我关心的 南方财经全媒体记者梁施婷 北京报道在全球高科技争夺战中,集成电路相关技术和产业已成为“兵家必争之地”,中国摆脱高端芯片进口依赖愈发紧迫。锚定集成电路产业发展面临的人才紧缺 。本文链接:美股,崩了http://www.sushuapos.com/show-1-34236-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
上一篇: 广州烟花汇演活动期间禁止私自放飞无人机