设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

阿里云:CPU为中心的计算体系也可加速AI推理

发布时间: 2024-01-13 13:52:11 来源: 中国科学报

 qDe速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

1月11日,阿里云宣布第八代企业级通用计算实例ECS g8i算力再升级,国内首发代号Emerald Rapids的第五代英特尔至强可扩展处理器,依托阿里云自研的“飞天+CIPU”架构体系,ECS g8i实例的整机性能最高提升85%,AI推理性能最高提升7倍,可支撑高达72B参数的大语言模型。qDe速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

阿里云弹性计算产品线总经理张献涛表示:“阿里云ECS g8i实例的强劲表现,证明了以CPU为中心的计算体系同样具备加速AI推理的巨大潜力,公共云不仅可胜任超大规模的AI模型,也为AI应用加速落地开辟了新路径。”qDe速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

对此,英特尔中国数据中心和人工智能集团至强客户解决方案事业部总经理李亚东解释说,最新上市的第五代英特尔至强? 可扩展处理器每个内核均内置 AI 加速功能,有能力处理要求严苛的 AI 工作负载。与上代相比,其AI训练性能提升多达 29%,AI推理能力提升高达 42%。qDe速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

生成式AI掀起的技术革命,正在推动计算范式发生根本性的变化。当前,AI大模型推理在算力上依然面临诸多挑战,例如首包延迟受限于并行处理能力与浮点运算能力、吞吐性能则受限于内存带宽和网络延迟等。 qDe速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

阿里云ECS g8i实例针对这些难题进行了优化,包括内置指令集从AVX512升级到了Intel  AMX高级矩阵扩展加速技术,可让生成式AI更快运行。相对于AVX512指令集,启用AMX AI加速后,ECS g8i 实例在int 8矩阵计算的性能最高提升7倍。基于AMX AI加速能力,g8i可更迅速地响应中小规模参数模型,运行知识检索、问答系统及摘要生成等AI工作负载时,起建成本相比A10 GPU云服务器下降50%。qDe速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

与此同时,基于自研eRDMA超低延时弹性网络,阿里云g8i实例集群拥有超低延时网络和高弹性优势,可支撑72B参数级别的大语言模型分布式推理,推理性能随集群规模接近线性加速,并可支持超过32batchsize的超大参数规模的AI模型负载,运行文生图、AI生成代码、虚拟助手以及创意辅助工具等AI工作负载。qDe速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

以阿里云通义千问开源的Qwen-72B大模型为例,可在g8i实例eRDMA网络构建的集群实现高效运行,在输入小于500字情况下,首包延时小于3秒,每秒可生成7个Token。qDe速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

由复旦大学发布的MOSS大模型一度引发关注,它背后的团队现在在关注哪方面的技术突破? 12月2日,中国软件领域规模最大、影 12月19日,《自然-计算科学》发表的一项研究描述了一种机器学习方法,能够从不同方面准确预测人类生活,包括早死可能性和 关于启动2024年与莫斯科大学互换奖学金、与圣彼得堡大学互换奖学金遴选工作的通知 根据《中国国家留学基金管理委 中国科协办公厅关于开展2023年度国家科学技术奖提名工作的通知 各全国学会、协会、研究会,各省、自治区、直辖市科 近日发表于《睡眠医学》的一项研究表明,“夜猫子”动脉钙化的概率几乎是“早起鸟”的两倍。在心血管疾病的早期阶段, 我国工程师领域又添了一个国家级的大奖。19日上午,“国家工程师奖”表彰大会在人民大会堂举行,81名个人被授予“国家 。

本文链接:阿里云:CPU为中心的计算体系也可加速AI推理http://www.sushuapos.com/show-11-2124-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 数学筑基,软件突围

下一篇: 高山书院学术管理委员会在京成立

热门资讯

推荐资讯

  • 日榜
  • 周榜
  • 月榜