·从宇宙到量子,物理学有一套大一统的理论统一起来,叫作Theory of Everything。今天深度学习没有这样的理论,所以叫作Theory of Anything。
·算力是门槛。“千卡万卡是钱堆出来的。以前有一句话叫贫穷限制想象力,现在贫穷可能扭曲想象力,因为如果没有卡,能想象要做的项目可能就不太一样了。”
“大模型大到一定地步以后就涌现出来。多大才涌现出来?没人讲得清楚。”3月23日,2024全球开发者先锋大会在上海开幕,美国国家工程院外籍院士沈向洋在《大模型时代的机遇和挑战》的演讲中分享了对大模型的思考。他表示,人工智能蓬勃发展,但人们对智能的本质并没有清晰认知。物理学是Theory of Everything,而深度学习就是Theory of Anything。
过去这几年,大模型的发展风起云涌,开源社区的活力和生命力非常强大。沈向洋说,文生图使得一言胜千图,一个简单的提示就可以做出了不起的图片。ChatGPT使得一句顶一万句,提出一个问题可以得到很多答案。Sora的出现使得输入几句提示就能产生大片效果。
这三件事让人们产生一个个焦虑,未来开发者的机会在哪里?沈向洋认为是多模态,多模态是通用人工智能的必经之路。以OpenAI代表的技术实际上是对不同模态的理解,“OpenAI的内部有两套体系,一是从文生图延展到文生视频,走的是Stable Diffusion路线,二是文生文,走的是Transformer路线。到现在为止,这两条线路还没完全统一起来,相信接下来中国的开发者、世界的开发者,很快会有这方面的突破。”
沈向洋分享了关于大模型的五方面思考。
第一,大模型的到来,强迫人类重新思考人机关系。“我们受到的冲击,到底有多少是机器智能的发展,有多少是人机交互的震撼。”他认为,不管是什么技术,最终目的是帮助人更好运用机器,不忘初心。
第二,大模型将横扫所有垂直行业。大模型可分为通用大模型、行业大模型、企业大模型和个人大模型。“一个通用大模型如果没有万卡、不上1万亿参数,基本上以后就不太好意思说这是一个通用模型了。行业大模型大致上是千亿参数、千亿卡的训练规模。企业大模型可能只需要100张卡、百亿参数。最有意思的是个人大模型,利用个性化参数,结合云和端,这是非常有意义的。”
第三,算力是门槛。影响算力的两大因素是模型大小和数据规模,随着参数增加,对算力的需求几乎是几何级的。“千卡万卡是钱堆出来的。以前有一句话叫贫穷限制想象力,现在贫穷可能扭曲想象力,因为如果没有卡,能想象要做的项目可能就不太一样了。”
第四,AI带来社会冲击。这些冲击包括对民众的冲击、企业的冲击、政府监管的冲击、社会发展的冲击,带来一本正经胡说八道、深度伪造等伦理问题,很多国家开始立法,这需要共同推动治理、向前发展。
第五,智能的本质。人工智能蓬勃发展,但人们对智能的本质并没有清晰认知。“大模型大到一定地步以后就涌现出来。多大才涌现出来?没人讲得清楚。”沈向洋表示,“很多人相信scaling law(规模法则),但今天的深度学习,理论非常欠缺。从宇宙到量子,物理学有一套大一统的理论统一起来,叫作Theory of Everything。今天深度学习没有这样的理论,所以叫作Theory of Anything。”
(原题:《沈向洋:大模型将横扫所有垂直行业,算力是门槛》)
近日,网红考研名师张雪峰在直播中称“所有文科都叫服务业”,总结起来就是“舔”,引发坊间热议;之后,他在致歉回应中称“ 未来,人工智能或将帮助科研工作者跳过文献检索、粗读的过程,直接找到需要的文献,大幅提升科研工作者的文献阅读效率。 未来航天会是什么样?它会是在现有技术的基础上缓慢地进步吗?还是会以一种更激进、更意想不到的方式向前?人们能否实现类似 近日,罗氏制药第三届支付创新大会在上海举办。本次活动以“同星共创,聚氏未来”为主题,汇聚了来自医药企业、商业保险 近日,“张雪峰称文科都是服务业”这一词条引发网友关注与热议。此前,“考研名师”张雪峰还说过,即使把孩子打晕,也不要 科技日报讯 (记者张佳欣)当有人开始哭泣时,其他人常常会感到同情和关心,但其背后的生物学原因不仅仅是激发了同情心。据 。本文链接:美国工程院外籍院士沈向洋:大模型将横扫所有垂直行业http://www.sushuapos.com/show-11-4172-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
上一篇: 江南大学新增3个本科专业