设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

直面大模型“大成本”挑战,如何提高算力效率?

2024-06-03 17:31:44 来源:

  直面大模型“大成本”挑战,如何提高算力效率?U8x速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  中新网北京6月3日电 (记者 夏宾)近年来,为了追求大模型的智慧能力,各国公司不停加码投入,4月,Meta宣布追加10亿美元投资,用于其AI芯片研发和AI数据中心建设;亚马逊为了建设新数据中心投入110亿美元。但在大模型扩张的背后,算力代价、能源代价同样巨大。U8x速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  有业界技术团队测算,若要对一个5000亿参数规模的单体大模型进行充分训练,所需算力基础设施约在10亿美元规模,每年消耗的电费在5.3亿元人民币。无论对于哪个机构、企业,这都是天文数字和巨大代价,中国也不例外。U8x速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  知名科学杂志《Nature》此前发表了一篇关于大模型未来发展之路的文章,《In Al, is bigger always better?》(人工智能,越大型越好?)。争议的出现,意味着AI发展方向出现了分歧。U8x速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  如今,“大”不再是模型的唯一追求,计算效率和算力开销两大问题成为新的行业焦点。U8x速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  对大模型推理成本的优化,可通过很多技术手段实现。首先是模型本身,模型结构、训练方法都可以持续改进,包括业界很关注的MoE(混合专家模型),就是优化推理成本很好的解决方案。其次是工程上的优化。大模型的调用量越大,优化推理成本的空间也越大。以前的模型都是单机推理,大模型用的是分布式推理。所以如果能把各种各样底层算力用得更好,推理成本就会大大降低。U8x速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  MoE大模型的盛行,实际上对应的正是模型能力和算力开销两大问题的解决。这也是为何众多大模型厂商如OpenAI、谷歌、Mistral AI、浪潮信息等陆续基于MoE架构升级自家大模型产品的原因。U8x速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  从浪潮信息发布的“源2.0-M32”开源大模型来看,其基于“源2.0”系列大模型已有工作基础,创新提出和采用了“基于注意力机制的门控网络”技术,构建包含32个专家(Expert)的混合专家模型(MoE),并大幅提升了模型算力效率,模型运行时激活参数为37亿,在业界主流基准评测中性能全面对标700亿参数的LLaMA3开源大模型。U8x速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  浪潮信息人工智能首席科学家吴韶华在接受中新网记者采访时说,我们一直在想如何以更低的算力消耗,提高整个大模型的应用效果,能让企业、机构以更小的算力代价去获得更高的模型能力。“这可能是中国发展自己的AI大模型比较行之有效的路径。”U8x速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  他直言,大模型推进速度越来越快,必须强调模型算力效率。“大家可以想象,效率越高就意味着在单位算力投入相等的情况下获得的精度回报越高,它对于训练和应用都非常有利。”U8x速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  “现实的算力是有限的,我们一再反复强调模算效率,试图针对当前算力情况闯出一条自己觉得比较好的路子。在固定每个Token算力不变的情况下,通过扩展专家数量可以获得更大参数量的模型,进而获得更高精度。”吴韶华说。U8x速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  他进一步称,整体来看,尽管当前模型的能力提升非常之快,但之前大家更多关注单个维度问题,即平均精度的提升。但大模型进入快速落地时代,就不得不考虑更多维度的问题,包括模算效率、精度、算力开销等。U8x速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  中国工程院院士郑纬民曾做过这样的计算,在大模型训练过程中,70%开销要花在算力上;推理过程中95%的花费也是在算力上。U8x速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  为解决大模型训练的算力不足问题,郑纬民建议,在推动智能计算中心建设同时也可以利用已有超算系统的空余算力。U8x速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  郑纬民表示,现有14个国家挂牌的超算系统,每台机器的建设成本都很高,成本在10亿元至20亿元,甚至更高。这些超算系统已经为中国的国民经济发展作出巨大贡献,但有些系统还有空余算力,这些空余算力也可被用来做大模型训练,且经过优化甚至可降低大模型训练成本。U8x速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  对于近期中国企业的一轮大模型降价,零一万物CEO李开复表示,未来整个行业的推理成本每年降低十倍是可以期待的,且这个趋势是必然的,如此会有更多人用上大模型,这是非常利好的消息。(完)U8x速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本文链接:直面大模型“大成本”挑战,如何提高算力效率?http://www.sushuapos.com/show-5-17209-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 知名品牌上新仅10多天,大批小学生家长被娃缠着买它:感觉被“绑架”了,又贵又占时间

下一篇: 南京:立案查处二手空调违规翻新

热门资讯

推荐资讯

  • 同程旅行投资运营青靛甪直沉浸式夜游景区将于4月30日开放

      近日,同程旅行对外宣布,由公司投资运营的古镇旅游升级改造项目——青靛甪直沉浸式夜游景区,将于4月30日正式对外开放。  据悉,2023年4月,同程旅行与甪直古镇达成战略合作,就

  • 北京“CCB建融家园•寓见未来”人才公寓推出近500套房源

      近日,在北京丰台区2024年首批街镇“民生项目池”清单创新发布活动获悉,位于南中轴国际文化科技园内的“CCB建融家园•寓见未来”人才公寓对外正式开放。  据悉,该人才公

  • 四川多个景区官宣免门票优惠政策

      “五一”假期即将到来。近期,四川多个景区官宣了“劳模”免票政策.    九寨沟景区  2024年5月1日至5月5日,对持有地市州及以上人民政府颁发的“劳动模范”证书、政

  • 亿元酒店狂卖21家,无人接盘?

    2024开年以来,文旅产业历经春节、清明等火热假期,旅游人次和旅游消费收入节节攀升,整体呈现欣欣向荣的发展态势,但具体到酒店市场来看并不乐观。近期社交媒体上流传的一份上海最

  • “京津冀协同发展10周年书法交流展”开幕

    4月28日,“翰墨弘道——京津冀协同发展10周年书法交流展”在北京一得阁美术馆开幕。现场共展出150余件作品,以京津冀区域书法家和书法爱

  • 黄山旅游2024年一季度实现营收3.36亿元

      4月29日,黄山旅游发布2024年第一季度财报。财报显示,黄山旅游2024年一季度实现营业收入3.36亿元,同比下降0.43%;归属于上市公司股东的净利润2549.99万元,同比下降60.51%。黄

  • 多地酒店不再要求“强制刷脸”

    近日,有媒体报道,在上海市旅馆业治安管理信息系统中相继有通知和提示发布,严禁对已出示本人有效身份证件的旅客进行“强制刷脸”核验,严禁发生不“刷脸”不能入住问题。据央视新

  • 逛公园是怎样流行起来的

    只要每天去公园待20分钟,即使不运动,也能让身心状态更好。这是目前在社交平台上爆火的“公园20分钟效应”现象。公园如今是城市里不可或缺的公共空间

  • 网络文学与评论有效互动,造就时代文学新景观

    网络文学正处在转型升级、迭代发展的进程中,不同类型的网络作家以不同的想象方式与叙事模式,生发网络文学的新变,在国内和海外不断拓展着网络文学影响

  • 斯里兰卡:继续免除中国等七国公民的签证费用

      据斯里兰卡第一新闻网(newsfirst)于当地时间5月6日晚间发表的报道,斯里兰卡内阁决定继续免除中国、印度、俄罗斯、日本、马来西亚、泰国和印度尼西亚七个国家的公民签证

  • 2024年轻人出游趋势:美食文化体验忙 “旅拍”热度暴涨

    为爱好说走就走、种草网红城市好玩不贵,对于能够记录美好瞬间的“旅拍”格外舍得投入……2024年,年轻人的个性化需求催生更多旅游新玩法

  • 时间与桑皮纸 亦敌亦友

    夜已深,窗外未静。寄居近处,灯火通明,南北向的一条马路,车流不息属常态。喇叭声时起,烧烤味不时飘来,兼有婴儿啼哭声、家长督学的呵斥声。所谓写作,只能见

  • 日榜
  • 周榜
  • 月榜