设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

华为昇腾推出高性能保精度量化方案,更好适配DeepSeek

发布时间: 来源: 观察者网

LHj速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

(文/万肇生 编辑/张广凯)LHj速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

近日,华为公开了昇腾服务器上部署DeepSeek V3/R1推理的最佳实践,并介绍了一系列创新技术。LHj速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

其中,华为在降低计算资源需求方面,创新提出了昇腾亲和的低比特量化解决方案OptiQuant,最终实现了INT8量化模式与FP8的模型推理精度持平。LHj速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

LHj速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

由于DeepSeek V3/R1模型是基于英伟达生态训练,并推荐使用FP8精度推理,而国产芯片普遍没有原生支持FP8精度,导致国产芯片对DeepSeek的适配不佳。华为昇腾的上述研究应该就是为了解决这一问题。LHj速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

通常情况下,在模型推理阶段,进行量化(如FP8量化为INT8)可以显著降低模型对硬件的存储需求和计算复杂度,但也会造成模型推理精度的损失以及逻辑错误等问题。因此如何保持推理精度,是低比特量化满足不同平台部署需求时的前提。LHj速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

据华为介绍,基于BF16的DeepSeek需要1.3TB的显存空间,同时导致极大的算力和跨机通信开销。而校准集的泛化性缺失导致了在很多任务上难以达到与原有模型相近的精度水平,甚至在某些场景下精度下降十分严重。同时,还要考虑如何设计昇腾亲和的量化算法,以发挥硬件性能。LHj速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

针对上述问题,华为提出了OptiQuant量化框架,一种高性能保精度量化方案,设计了层间自动混精、自动混合校准、离群值抑制、可学习的截断和SSZW参数量化算法。除了支持业界主流量化算法功能之外,它还新增支持三个功能:接入自定义量化算法和数值类型,可以将多种量化算法的自由组合搭配使用;支持业内主流评测数据集和用户自定义的数据校准集;支持数据并行和流水并行,针对不同大小的大语言模型实现精度验证性能加速。LHj速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OptiQuant框架主要由以下几个模块组成:LHj速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

量化类型和数值类型:OptiQuant支持了Int2/4/8和FP8/HiFloat8等数据类型,支持业界的Qserve,HQQ,LUT等量化方法,在此基础上提出了可学习截断和量化参数优化等算法,进一步减少了量化误差。 LHj速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

多样化测试数据集和用户自定义校准集:多样化测试数据集和用户自定义校准集:OptiQuant支持了判断题,问答题,代码题和数学题等多种测试类别,语种上支持了十种常见语言。此外,OptiQuant支持用户自定义校准集,提升模型量化过程中的泛化性。 LHj速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

量化权重生成:OptiQuant提出了自适应层间混精算法,并且根据对应的量化配置生成对应的权重参数,通过去冗余技术减少参数保存的参数量;OptiQuant进一步提出了FlexSQ等算法,在数据校准过程中,对大模型激活异常值进行了平滑处理,有助于对激活做低比特量化。 LHj速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

最终,基于Atlas 800I A2服务器的精度测试实验结果显示,对于DeepSeek-V3-0324模型,W8A8C16和W4A8C16均采用Per-channel量化,实现了推理精度与FP8-GPU持平。LHj速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

LHj速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

LHj速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

华为表示,在DeepSeek R1/V3大模型推理场景中,实现了INT8量化模式与FP8的模型推理精度持平,而且进一步发挥了华为Atlas 800I A2和CloudMatrix384集群推理硬件性能。而相关代码也将逐步开源。LHj速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本文系观察者网独家稿件,未经授权,不得转载。 LHj速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本文链接:华为昇腾推出高性能保精度量化方案,更好适配DeepSeekhttp://www.sushuapos.com/show-3-144845-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 华为折叠电脑更换全新屏幕需1.5万

下一篇: “去耐克化”,滔搏想做运动品牌的“MCN”

热门资讯

  • 英特尔获美军一笔长期订单

    当地时间1月20日,英特尔政府技术部门副总裁詹姆斯·丘在社交平台宣布,该公司已与美国国防部下属的导弹防御局(MDA)签下一笔长期订单。 詹姆斯·丘表示,“英特尔成为导弹防御局

  • 贾国龙的十字路口

    他一手把来自内蒙县城的小饭馆带到中国餐饮业头部,但他的局限性也造成了西贝今天的危机。 走进北京丰台区一家西贝门店时,正是中午用餐高峰期,店内坐

  • 垄断隐忧与规范机遇:梯媒并购背后的行业重构

    日前,国家市场监督管理总局对携程涉嫌滥用市场支配地位实施垄断行为正式立案调查,这记开年重锤不仅引发旅游行业震动,联想到此前监管层对“二选一”行为的巨额罚款,更让资本

  • 央行:加快建设人民币跨境支付体系

      中新经纬1月21日电 央行网站21日消息,2026年1月15日,中国人民银行召开2026年支付结算工作会议。会议总结2025年支付结算工作情况,分析当前形势,部署2026年重点工作。  会

  • 50万亿定存到期 谁能接住“泼天富贵”

      50万亿定存到期 谁能接住“泼天富贵”    2026年,一场规模空前的“高息定存到期”热议席卷市场,50万亿元的天量资金迎来集中解锁窗口,成为搅动居民资产配置格局的“关键

  • 银行保管箱“一箱难求” 黄金投资带火银行“小众”业务

      银行保管箱“一箱难求” 黄金投资带火银行“小众”业务    本报记者 熊 悦  “目前,我们营业部排队预约小规格保管箱的人数有200多位,如果客户需要预约大规格保管箱

  • 5部门:在武汉天河国际机场等41个口岸各新设1家口岸进境免税店

      中新经纬1月21日电 财政部网站21日发布《关于口岸进境免税店有关事宜的通知》(下称通知)。其中明确,在武汉天河国际机场等41个口岸各新设1家口岸进境免税店。  通知由

  • 亦诺微医药赴港上市 未有产品商业化

      中新经纬1月21日电 (王玉玲)近日,亦诺微医药再次递表港交所。该公司曾于2025年6月25日提交上市申请,后于2025年12月25日因招股书满6个月失效。  招股书显示,亦诺微医药是

  • 金荣中国贵金属官网app最新版下载

    随着时代的飞速发展,投资方式也在不断革新。在贵金属投资领域,金荣中国始终紧跟潮流,不断创新。金荣中国贵金属官网app最新版的推出,无疑是投资领域的一次重大变革。对于投资者

  • 郑韶辉的投资哲学:在周期低谷中看见价值的基石

    在波谲云诡的投资市场,如何穿越周期,捕获长期可持续的价值?著名科技投资家、浙江国贸东方资本创始人郑韶辉,以其独到的“三种战术”投资理念,在硬科技投资领域留下了深刻的印记。

  • Congratulations!2025ECI年度创新人物揭晓:唯创新以致远

    2026年1月15日,以“Nothing but Innovation 唯创新 以致远”为主题的ECI 2025年度创新人物颁奖盛典在广州举行。典礼表彰了全球杰出创新者,涵盖年度创新领袖人物、企业家、首

  • 光线传媒新公司叫一刻光

    【#光线传媒新公司叫一刻光# #光线传媒在北京成立文化科技公司#】天眼查工商信息显示,近日,北京一刻光文化科技有限公司成立,法定代表人为邢嘉芸,注册资本100万人民币,经营范围包

推荐资讯

  • 日榜
  • 周榜
  • 月榜