设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

直面大模型“大成本”挑战,如何提高算力效率?

发布时间: 来源:

  直面大模型“大成本”挑战,如何提高算力效率?4l2速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  中新网北京6月3日电 (记者 夏宾)近年来,为了追求大模型的智慧能力,各国公司不停加码投入,4月,Meta宣布追加10亿美元投资,用于其AI芯片研发和AI数据中心建设;亚马逊为了建设新数据中心投入110亿美元。但在大模型扩张的背后,算力代价、能源代价同样巨大。4l2速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  有业界技术团队测算,若要对一个5000亿参数规模的单体大模型进行充分训练,所需算力基础设施约在10亿美元规模,每年消耗的电费在5.3亿元人民币。无论对于哪个机构、企业,这都是天文数字和巨大代价,中国也不例外。4l2速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  知名科学杂志《Nature》此前发表了一篇关于大模型未来发展之路的文章,《In Al, is bigger always better?》(人工智能,越大型越好?)。争议的出现,意味着AI发展方向出现了分歧。4l2速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  如今,“大”不再是模型的唯一追求,计算效率和算力开销两大问题成为新的行业焦点。4l2速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  对大模型推理成本的优化,可通过很多技术手段实现。首先是模型本身,模型结构、训练方法都可以持续改进,包括业界很关注的MoE(混合专家模型),就是优化推理成本很好的解决方案。其次是工程上的优化。大模型的调用量越大,优化推理成本的空间也越大。以前的模型都是单机推理,大模型用的是分布式推理。所以如果能把各种各样底层算力用得更好,推理成本就会大大降低。4l2速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  MoE大模型的盛行,实际上对应的正是模型能力和算力开销两大问题的解决。这也是为何众多大模型厂商如OpenAI、谷歌、Mistral AI、浪潮信息等陆续基于MoE架构升级自家大模型产品的原因。4l2速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  从浪潮信息发布的“源2.0-M32”开源大模型来看,其基于“源2.0”系列大模型已有工作基础,创新提出和采用了“基于注意力机制的门控网络”技术,构建包含32个专家(Expert)的混合专家模型(MoE),并大幅提升了模型算力效率,模型运行时激活参数为37亿,在业界主流基准评测中性能全面对标700亿参数的LLaMA3开源大模型。4l2速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  浪潮信息人工智能首席科学家吴韶华在接受中新网记者采访时说,我们一直在想如何以更低的算力消耗,提高整个大模型的应用效果,能让企业、机构以更小的算力代价去获得更高的模型能力。“这可能是中国发展自己的AI大模型比较行之有效的路径。”4l2速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  他直言,大模型推进速度越来越快,必须强调模型算力效率。“大家可以想象,效率越高就意味着在单位算力投入相等的情况下获得的精度回报越高,它对于训练和应用都非常有利。”4l2速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  “现实的算力是有限的,我们一再反复强调模算效率,试图针对当前算力情况闯出一条自己觉得比较好的路子。在固定每个Token算力不变的情况下,通过扩展专家数量可以获得更大参数量的模型,进而获得更高精度。”吴韶华说。4l2速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  他进一步称,整体来看,尽管当前模型的能力提升非常之快,但之前大家更多关注单个维度问题,即平均精度的提升。但大模型进入快速落地时代,就不得不考虑更多维度的问题,包括模算效率、精度、算力开销等。4l2速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  中国工程院院士郑纬民曾做过这样的计算,在大模型训练过程中,70%开销要花在算力上;推理过程中95%的花费也是在算力上。4l2速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  为解决大模型训练的算力不足问题,郑纬民建议,在推动智能计算中心建设同时也可以利用已有超算系统的空余算力。4l2速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  郑纬民表示,现有14个国家挂牌的超算系统,每台机器的建设成本都很高,成本在10亿元至20亿元,甚至更高。这些超算系统已经为中国的国民经济发展作出巨大贡献,但有些系统还有空余算力,这些空余算力也可被用来做大模型训练,且经过优化甚至可降低大模型训练成本。4l2速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  对于近期中国企业的一轮大模型降价,零一万物CEO李开复表示,未来整个行业的推理成本每年降低十倍是可以期待的,且这个趋势是必然的,如此会有更多人用上大模型,这是非常利好的消息。(完)4l2速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  春节假期中国快递包裹投递量日均同比增82.1%  中新社北京2月18日电 (记者 刘育英)中国国家邮政局监测数据显示,今年春节长假期间(2月10日至17日),中国邮政快递业投递快递包裹6.41亿件,日均投递量与2023年春节假期 近日,中共中央印发了修订后的《中国共产党巡视工作条例》(以下简称《条例》),并发出通知,要求各地区各部门认真遵照执行。通知指出,《条例》坚持以习近平新时代中国特色社会主义思想为指导,深入贯彻习近 为降低新一轮低温雨雪冰冻天气对农业生产带来的影响,湖北省沙洋县农业农村局组织技术服务指导组深入田间地头,重点围绕蔬菜大棚、油菜等主打产业,开展防冻避灾、病虫防控等全程技术指导服务,最大限度减少 2月21日,湖北省仙桃市委书记孙道军,市委副书记、代市长熊享涛,会见湖北鼎龙控股股份有限公司董事长朱双全、深圳深创生物医药有限公司董事长马亚平一行,就具体项目开展洽谈。政企双方表示,要务实合作、携   “新年刚过,我已经买好了十一旅游的机票”    中新网北京2月23日电(张钰惠)在年初就买好全年的旅行机票,是一种怎样的体验?近日,三亚、哈尔滨等网红城市的天价返程机票引发关注。为了最大程度上避开高价机票,压缩旅   自然资源部:22个省级国土空间规划已获批准实施  中新社北京2月22日电 (记者 庞无忌)中国正加速推进各级国土空间规划编制实施。  中国自然资源部22日透露,截至目前,所有省级和新疆生产建设兵团国土空间规划均已 。

本文链接:直面大模型“大成本”挑战,如何提高算力效率?http://www.sushuapos.com/show-5-17209-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 知名品牌上新仅10多天,大批小学生家长被娃缠着买它:感觉被“绑架”了,又贵又占时间

下一篇: 南京:立案查处二手空调违规翻新

热门资讯

  • 人工智能客服不能阻碍沟通

      人工智能客服不能阻碍沟通  AI客服的理想与现实总是存在落差。我们当然希望AI客服能更“聪明”一些。但在此之前,企业不应过分依赖AI客服,而该给消费者多一个选项。  

  • 女子挺5个月孕肚征婚?重庆江北警方通报

      女子挺5个月孕肚征婚?重庆江北警方通报  中新网1月11日电 据重庆市公安局江北区分局官方微博消息,近日,网传“女子挺5个月孕肚征婚 ”视频,引发网友关注。经查,该女子陈某

  • 国家开发银行原副行长王用生被决定逮捕

      中新经纬1月11日电 据高检网11日消息,国家开发银行原党委委员、副行长王用生涉嫌受贿一案,由国家监察委员会调查终结,移送检察机关审查起诉。日前,经最高人民检察院指定管辖

  • 节后成品油调价或搁浅!下一轮存上调概率

      中新经纬2月19日电 (熊思怡)19日24时,国内成品油新一轮调价窗口将开启。机构普遍预计,本次成品油零售限价调整将搁浅。  本周期横跨春节假期前后,原油市场整体偏强运行。

  • 龙年首场寒潮来袭,多地高速、列车受影响

      中新经纬2月18日电 龙年首场寒潮来袭,雨雪、大风、沙尘暴齐袭,多地高速受影响堵车或暂时封闭、列车停运。  中央气象台18日晨将寒潮预警提升至橙色,这也是寒潮预警的最高

  • 中国工程院院士、校长宋保维:发挥教育科技人才优势 为建设制造强国贡献高校力量

    今天《中国电子报》刊登西北工业大学校长、中国工程院院士宋保维署名文章《发挥教育科技人才优势 为建设制造强国贡献高校力量》现将文章登载如下,以飨读

  • 社评:布林肯的“餐桌菜单论”说明了什么

    美国国务卿布林肯近日在参加慕安会时说的一句话,可以被解读的空间很大,也值得深入解读一下。他在回答主持人关于“美中紧张局势正在导致更大的分裂”提问

  • 特朗普卖鞋——“宇宙尽头”是带货还是选票?

    美国总统选战日渐升温之际,美国前总统特朗普日前出现在宾夕法尼亚州费城鞋展,化身“带货达人”,推介其本人同名品牌运动鞋,迅速冲上“热搜”。特朗普品牌运

  • 保畅保供保民生

    新华社济南2月22日电(记者陈国峰、张钟仁)连日来,山东多地迎来大风降温和雨雪天气。21日,受降雪影响,济南西站部分列车降速运行,出现晚点情况。售票大厅内,记者看

  • 湖北天门:铆足干劲 奋力夺取一季度“开门红”

    一年之计在于春。2月20日,湖北省天门市委书记、市人大常委会主任纪道清调研工业经济“开门红”工作。他强调,要牢牢把握高质量发展这个首要任务,把稳增长放在

  • 广西南宁新能源全产业链加快成型

      广西南宁新能源全产业链加快成型  中新网南宁2月22日电 (黄令妍 韦雅丹)广西南宁市工信局党组书记、局长卢晴22日介绍,当地新能源全产业链加快成型,比亚迪、多氟多等一

  • 福建今年首个核电机组工程开工

      福建今年首个核电机组工程开工  中新社漳州2月22日电 (记者 张金川)福建漳州核电3号机组22日开工建设,这是福建今年首台开工建设的核电机组,标志着漳州核电二期工程建设

推荐资讯

  • 日榜
  • 周榜
  • 月榜
    SQL Error: select * from ***_ecms_news11 where id in(98,,254,266,247,275,159,276,109,205,178,262) limit 12