在航空领域,有个说法叫“力大砖飞”,往往用来形容某种战斗机气动外形设计一般,依靠强大的发动机推力获得较好的飞行性能。
近日,马斯克旗下人工智能企业xAI推出Grok 3系列大模型,称其在数学、科学和编码等领域击败了Open AI的GPT-4o,以及深度探索公司的DeepSeek V3等“前辈”。马斯克称Grok 3为“地球上最聪明的AI”。Grok 3在训练中使用了20万张高性能GPU,远超GPT-4的2.5万张和DeepSeek的2048张。有报道称,Grok 3使用的算力是GPT-4的20倍、DeepSeek的263倍。
难道说,AI的发展趋势将要呈现为“算力大”而“模型飞”吗?
毫无疑问,算力是推动AI发展最关键的推动力之一。DeepSeek通过创新算法大幅节约算力令人惊艳,但算力的重要性不应因此被贬低。2月初,美国兰德智库在评论中写道,如果DeepSeek可以使用更多的芯片,它就可以训练出更强大的AI模型,更早地做出某些发现。
Grok 3使用了更复杂的推理模型,训练时长达到2亿GPU小时,但训练却只用了8个月,主要归功于其前所未有的算力支撑。更强的算力既能够满足更复杂模型、更大量数据的训练需求,又可以加快计算速度、缩短训练时间,促进AI模型的快速迭代和进步。
但是,AI的发展也不应完全依靠算力,单纯走“力大砖飞”的技术路线。
对Grok 3的一些对比测试发现,算力优势似乎没有带来碾压式的性能优势。2月19日,号称“印度最大的数据科学社区”的Analytics Vidhya发表文章称,对比使用Grok 3和DeepSeek-R1处理Python代码编程等五个特定问题时发现,DeepSeek-R1对四个问题的回答优于Grok 3。无独有偶,专门研究ChatGPT等AI工具使用技巧、网名“Alex Prompter”的X用户也使用Grok 3、DeepSeek-R1和ChatGPT o3-mini处理五个特定问题,结果Grok 3仅在两个问题中获胜。
更值得关注的是,算力在推动AI进步的同时,支撑算力的芯片产能和维持算力的能源消耗也开始遇到壁垒。AI发展趋势研究机构EpochAI统计发现,2019年至今,用于AI模型训练的算力约每6个月翻一番,每年增长4—5倍,而同期英伟达出货的GPU芯片计算能力10个月才能翻一番。今年1月,兰德智库预测,到2028年,单个数据中心AI训练耗电量可能达到1吉瓦,需要一座核电站供电;到2030年,则需要8座核电站。芯片产能和电力需求正在成为制约算力提升的瓶颈问题。
AI发展的历史也表明,即使在算力蓬勃发展的近10年,算法的贡献也功不可没。EpochAI和MIT FutureTech的联合研究认为,从2014年到2023年,在对AI性能提升的贡献中,算力约占65%、算法占35%,这还是DeepSeek发布前的结果。研究还发现,算法的改进通常具有不可预测性和间歇性,有可能长期研究没有结果,也有可能一个灵感带来AI性能的大幅提升。
去年8月,EpochAI发表报告指出,在芯片、电力等制约下,到2030年,美国的AI模型算力仍有潜力提升10000倍,但需要数千亿美元的投入。巧合的是,特朗普上台伊始就宣布了“星际之门”计划,投资5000亿美元建设人工智能基础设施。
因此,在一段时间内,算力堆砌不会停止,也很可能仍是AI发展的重要引擎,绝不能忽视。但是,DeepSeek的横空出世也足以告诉人们,在AI算法领域,同样需要加强投入,而且要坚持不懈地摸索,哪怕经历漫长的沉默。
在航空领域,有个说法叫“力大砖飞”,往往用来形容某种战斗机气动外形设计一般,依靠强大的发动机推力获得较好的飞行性能。
近日,马斯克旗下人工智能企业xAI推出Grok 3系列大模型,称其在数学、科学和编码等领域击败了Open AI的GPT-4o,以及深度探索公司的DeepSeek V3等“前辈”。马斯克称Grok 3为“地球上最聪明的AI”。Grok 3在训练中使用了20万张高性能GPU,远超GPT-4的2.5万张和DeepSeek的2048张。有报道称,Grok 3使用的算力是GPT-4的20倍、DeepSeek的263倍。
难道说,AI的发展趋势将要呈现为“算力大”而“模型飞”吗?
毫无疑问,算力是推动AI发展最关键的推动力之一。DeepSeek通过创新算法大幅节约算力令人惊艳,但算力的重要性不应因此被贬低。2月初,美国兰德智库在评论中写道,如果DeepSeek可以使用更多的芯片,它就可以训练出更强大的AI模型,更早地做出某些发现。
Grok 3使用了更复杂的推理模型,训练时长达到2亿GPU小时,但训练却只用了8个月,主要归功于其前所未有的算力支撑。更强的算力既能够满足更复杂模型、更大量数据的训练需求,又可以加快计算速度、缩短训练时间,促进AI模型的快速迭代和进步。
但是,AI的发展也不应完全依靠算力,单纯走“力大砖飞”的技术路线。
对Grok 3的一些对比测试发现,算力优势似乎没有带来碾压式的性能优势。2月19日,号称“印度最大的数据科学社区”的Analytics Vidhya发表文章称,对比使用Grok 3和DeepSeek-R1处理Python代码编程等五个特定问题时发现,DeepSeek-R1对四个问题的回答优于Grok 3。无独有偶,专门研究ChatGPT等AI工具使用技巧、网名“Alex Prompter”的X用户也使用Grok 3、DeepSeek-R1和ChatGPT o3-mini处理五个特定问题,结果Grok 3仅在两个问题中获胜。
更值得关注的是,算力在推动AI进步的同时,支撑算力的芯片产能和维持算力的能源消耗也开始遇到壁垒。AI发展趋势研究机构EpochAI统计发现,2019年至今,用于AI模型训练的算力约每6个月翻一番,每年增长4—5倍,而同期英伟达出货的GPU芯片计算能力10个月才能翻一番。今年1月,兰德智库预测,到2028年,单个数据中心AI训练耗电量可能达到1吉瓦,需要一座核电站供电;到2030年,则需要8座核电站。芯片产能和电力需求正在成为制约算力提升的瓶颈问题。
AI发展的历史也表明,即使在算力蓬勃发展的近10年,算法的贡献也功不可没。EpochAI和MIT FutureTech的联合研究认为,从2014年到2023年,在对AI性能提升的贡献中,算力约占65%、算法占35%,这还是DeepSeek发布前的结果。研究还发现,算法的改进通常具有不可预测性和间歇性,有可能长期研究没有结果,也有可能一个灵感带来AI性能的大幅提升。
去年8月,EpochAI发表报告指出,在芯片、电力等制约下,到2030年,美国的AI模型算力仍有潜力提升10000倍,但需要数千亿美元的投入。巧合的是,特朗普上台伊始就宣布了“星际之门”计划,投资5000亿美元建设人工智能基础设施。
因此,在一段时间内,算力堆砌不会停止,也很可能仍是AI发展的重要引擎,绝不能忽视。但是,DeepSeek的横空出世也足以告诉人们,在AI算法领域,同样需要加强投入,而且要坚持不懈地摸索,哪怕经历漫长的沉默。
记者3月18日从兰州大学获悉,该校动物医学与生物安全学院郑海学教授团队解析了非洲猪瘟病毒(ASFV)在猪体内感染的靶细胞,以及在靶细胞内延长感染的机制。这项研究系统阐明了ASFV感染的细胞嗜性、 3月17日,记者从海南大学获悉,该校化学化工学院副教授李萌婷与相关研究团队合作,合成了多功能复合金纳米花颗粒。该颗粒配合温和光热、光动力、药物控释联合疗法,可有效促进感染性组织再生修复。 21世纪经济报道见习记者 顾婷婷 杭州报道如何让沉睡在实验室里的专利真正应用到车间,真正面向市场,转化为真正的新质生产力?3月19日,由国家知识产权局组织的高校和科研机构存量专利盘活 记者3月21日获悉,由中国科学院自动化研究所和中国科学院香港创新研究院联合研发的医疗领域AI多模态大模型——CARES Copilot 1.0日前在香港正式发布,现已面向香港神经外科医生开放使 3月22日消息,中国互联网络信息中心(CNNIC)今天发布了《中国互联网络变化状况计算报告》。《报告》显示,截至2023年12月,我国网民规模达10.92亿人,较2022年12月新增网民2480万人,互联网普及率达77.5%。截 回望一加去年的整体节奏,如果要用一个词来总结其数字系列和Ace系列的概况,那就是“卷”!从外观质感、内存性能到整机体验,与友商的相互竞争中,一加表现的都比较强势,搭配清晰的产品定位策略和稳扎稳打 。本文链接:AI发展不能只靠“力大砖飞”http://www.sushuapos.com/show-2-10881-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。