AI发展不能只靠“力大砖飞”

发布时间: 2025-02-26 09:12:41 来源：科技日报

观看：150

在航空领域，有个说法叫“力大砖飞”，往往用来形容某种战斗机气动外形设计一般，依靠强大的发动机推力获得较好的飞行性能。

近日，马斯克旗下人工智能企业xAI推出Grok 3系列大模型，称其在数学、科学和编码等领域击败了Open AI的GPT-4o，以及深度探索公司的DeepSeek V3等“前辈”。马斯克称Grok 3为“地球上最聪明的AI”。Grok 3在训练中使用了20万张高性能GPU，远超GPT-4的2.5万张和DeepSeek的2048张。有报道称，Grok 3使用的算力是GPT-4的20倍、DeepSeek的263倍。

难道说，AI的发展趋势将要呈现为“算力大”而“模型飞”吗？

毫无疑问，算力是推动AI发展最关键的推动力之一。DeepSeek通过创新算法大幅节约算力令人惊艳，但算力的重要性不应因此被贬低。2月初，美国兰德智库在评论中写道，如果DeepSeek可以使用更多的芯片，它就可以训练出更强大的AI模型，更早地做出某些发现。

Grok 3使用了更复杂的推理模型，训练时长达到2亿GPU小时，但训练却只用了8个月，主要归功于其前所未有的算力支撑。更强的算力既能够满足更复杂模型、更大量数据的训练需求，又可以加快计算速度、缩短训练时间，促进AI模型的快速迭代和进步。

但是，AI的发展也不应完全依靠算力，单纯走“力大砖飞”的技术路线。

对Grok 3的一些对比测试发现，算力优势似乎没有带来碾压式的性能优势。2月19日，号称“印度最大的数据科学社区”的Analytics Vidhya发表文章称，对比使用Grok 3和DeepSeek-R1处理Python代码编程等五个特定问题时发现，DeepSeek-R1对四个问题的回答优于Grok 3。无独有偶，专门研究ChatGPT等AI工具使用技巧、网名“Alex Prompter”的X用户也使用Grok 3、DeepSeek-R1和ChatGPT o3-mini处理五个特定问题，结果Grok 3仅在两个问题中获胜。

更值得关注的是，算力在推动AI进步的同时，支撑算力的芯片产能和维持算力的能源消耗也开始遇到壁垒。AI发展趋势研究机构EpochAI统计发现，2019年至今，用于AI模型训练的算力约每6个月翻一番，每年增长4—5倍，而同期英伟达出货的GPU芯片计算能力10个月才能翻一番。今年1月，兰德智库预测，到2028年，单个数据中心AI训练耗电量可能达到1吉瓦，需要一座核电站供电；到2030年，则需要8座核电站。芯片产能和电力需求正在成为制约算力提升的瓶颈问题。

AI发展的历史也表明，即使在算力蓬勃发展的近10年，算法的贡献也功不可没。EpochAI和MIT FutureTech的联合研究认为，从2014年到2023年，在对AI性能提升的贡献中，算力约占65%、算法占35%，这还是DeepSeek发布前的结果。研究还发现，算法的改进通常具有不可预测性和间歇性，有可能长期研究没有结果，也有可能一个灵感带来AI性能的大幅提升。

去年8月，EpochAI发表报告指出，在芯片、电力等制约下，到2030年，美国的AI模型算力仍有潜力提升10000倍，但需要数千亿美元的投入。巧合的是，特朗普上台伊始就宣布了“星际之门”计划，投资5000亿美元建设人工智能基础设施。

因此，在一段时间内，算力堆砌不会停止，也很可能仍是AI发展的重要引擎，绝不能忽视。但是，DeepSeek的横空出世也足以告诉人们，在AI算法领域，同样需要加强投入，而且要坚持不懈地摸索，哪怕经历漫长的沉默。

在航空领域，有个说法叫“力大砖飞”，往往用来形容某种战斗机气动外形设计一般，依靠强大的发动机推力获得较好的飞行性能。

近日，马斯克旗下人工智能企业xAI推出Grok 3系列大模型，称其在数学、科学和编码等领域击败了Open AI的GPT-4o，以及深度探索公司的DeepSeek V3等“前辈”。马斯克称Grok 3为“地球上最聪明的AI”。Grok 3在训练中使用了20万张高性能GPU，远超GPT-4的2.5万张和DeepSeek的2048张。有报道称，Grok 3使用的算力是GPT-4的20倍、DeepSeek的263倍。

难道说，AI的发展趋势将要呈现为“算力大”而“模型飞”吗？

毫无疑问，算力是推动AI发展最关键的推动力之一。DeepSeek通过创新算法大幅节约算力令人惊艳，但算力的重要性不应因此被贬低。2月初，美国兰德智库在评论中写道，如果DeepSeek可以使用更多的芯片，它就可以训练出更强大的AI模型，更早地做出某些发现。

Grok 3使用了更复杂的推理模型，训练时长达到2亿GPU小时，但训练却只用了8个月，主要归功于其前所未有的算力支撑。更强的算力既能够满足更复杂模型、更大量数据的训练需求，又可以加快计算速度、缩短训练时间，促进AI模型的快速迭代和进步。

但是，AI的发展也不应完全依靠算力，单纯走“力大砖飞”的技术路线。

对Grok 3的一些对比测试发现，算力优势似乎没有带来碾压式的性能优势。2月19日，号称“印度最大的数据科学社区”的Analytics Vidhya发表文章称，对比使用Grok 3和DeepSeek-R1处理Python代码编程等五个特定问题时发现，DeepSeek-R1对四个问题的回答优于Grok 3。无独有偶，专门研究ChatGPT等AI工具使用技巧、网名“Alex Prompter”的X用户也使用Grok 3、DeepSeek-R1和ChatGPT o3-mini处理五个特定问题，结果Grok 3仅在两个问题中获胜。

更值得关注的是，算力在推动AI进步的同时，支撑算力的芯片产能和维持算力的能源消耗也开始遇到壁垒。AI发展趋势研究机构EpochAI统计发现，2019年至今，用于AI模型训练的算力约每6个月翻一番，每年增长4—5倍，而同期英伟达出货的GPU芯片计算能力10个月才能翻一番。今年1月，兰德智库预测，到2028年，单个数据中心AI训练耗电量可能达到1吉瓦，需要一座核电站供电；到2030年，则需要8座核电站。芯片产能和电力需求正在成为制约算力提升的瓶颈问题。

AI发展的历史也表明，即使在算力蓬勃发展的近10年，算法的贡献也功不可没。EpochAI和MIT FutureTech的联合研究认为，从2014年到2023年，在对AI性能提升的贡献中，算力约占65%、算法占35%，这还是DeepSeek发布前的结果。研究还发现，算法的改进通常具有不可预测性和间歇性，有可能长期研究没有结果，也有可能一个灵感带来AI性能的大幅提升。

去年8月，EpochAI发表报告指出，在芯片、电力等制约下，到2030年，美国的AI模型算力仍有潜力提升10000倍，但需要数千亿美元的投入。巧合的是，特朗普上台伊始就宣布了“星际之门”计划，投资5000亿美元建设人工智能基础设施。

因此，在一段时间内，算力堆砌不会停止，也很可能仍是AI发展的重要引擎，绝不能忽视。但是，DeepSeek的横空出世也足以告诉人们，在AI算法领域，同样需要加强投入，而且要坚持不懈地摸索，哪怕经历漫长的沉默。

记者从中国科学院金属研究所获悉，该所沈阳材料科学国家研究中心胡卫进研究员与合作者，提出利用缓冲层定量调控薄膜应变，延迟铁电薄膜晶格弛豫从而增强铁电极化强度的策略，成功揭示极化强度同铁电据法新社3月18日报道，周一，美国半导体巨头英伟达公司发布了其最新型号的电子芯片，这些芯片旨在支持人工智能（AI）革命，英伟达正努力巩固其作为人工智能领域关键供应商的地位。“我们需要更加强大的近日，我国“主要作物丰产增效科技创新工程”重点专项“优质双季超级稻丰产增效技术研发与集成示范”项目，在湖南岳阳宣布启动。据了解，该项目主要聚焦优质双季超级稻丰产增效技术研发，着力探明双 21世纪经济报道记者雷晨北京报道近日，国内AI领域的明星产品——Kimi智能助手，因流量激增遭遇了短暂的服务中断。月之暗面随后发布公告，对此次服务中断事件进行了说明，并采取了一系列紧　　“AI钢铁侠”黄仁勋，又进化了英伟达　　作者丨倪雨晴　　2024年，英伟达一年一度的GTC大会已然成为AI界春晚，现场座无虚席，全球AI爱好者翘首以待黄仁勋的独家SOLO。　　北京时间3月19日凌晨，GTC终于拉开大幕。英伟达创　　盲视技术已在猴子身上见效！马斯克脑机接口公司新目标：让盲人重见光明　　澎湃新闻记者吴遇利　　Neuralink新技术或将造福数千万名失明人士。　　当地时间3月21日，特斯拉CEO埃隆・马斯克在社交平台X(原推特)发文称，。

本文链接：AI发展不能只靠“力大砖飞”http://www.sushuapos.com/show-2-10881-0.html

声明：本网站为非营利性网站，本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：国务院国资委：国资央企要抓住人工智能产业发展的战略窗口期

下一篇： 2024年1159万间客房实现“便捷看电视”

AI发展不能只靠“力大砖飞”

热门资讯

推荐资讯

科技最热文章