DeepSeek的爆火出圈为国产芯片同时带来了机会与挑战。一方面,新锐模型和AI原生应用的爆发会产生更多算力需求,但同时,由于国产芯片在底层架构和软件生态上的差异,如何高效适配AI模型并充分发挥算力潜力成为国产芯片领域亟待解决的问题。
近日,北京电子数智科技有限责任公司(以下简称“北电数智”)依托其“宝塔·模型适配平台”成功完成DeepSeek V3/R1全尺寸模型与海光DCU、华为、壁仞科技、沐曦等多款国产芯片的混元算力适配,为开发者和企业提供了更灵活、高效的算力支持。
技术创新:DeepSeek模型性能领先
DeepSeek模型作为国产AI技术的代表,采用了多项创新技术,包括混合专家系统(DeepSeekMoE)、多头潜在注意力机制(MLA)以及自研训练框架。这使DeepSeek在大幅减少算力开销的情况下实现了R1模型与OpenAI o1相当、V3模型与OpenAI 4o相当的性能表现,展现出高推理效率和低训练成本的优势。
宝塔·模型适配平台:抹平芯片差异,异构算力高效支撑模型
北电数智“宝塔·模型适配平台”抹平了不同芯片架构的差异,快速实现对DeepSeek模型的优化支持和硬件适配。用户无需关注底层硬件技术细节,平台会根据模型调用需求自动匹配合适的算力资源,大幅降低了开发门槛。目前,该平台已完成24款基座大模型的适配工作,为开发者提供了更多算力选择。
混元推理技术:优化效率,降低成本
针对DeepSeek类超大模型的推理任务,数据中心的集群化推理技术显得尤为重要,例如PD分离(Prefill-Decode分离)技术就可由不同芯片完成不同阶段推理任务实现。北电数智的混元推理技术路线与DeepSeek的技术路线高度契合,能有效解决算力不足问题,为大规模AI应用创造便利条件。
推动国产算力发展:从适配到生态建设
DeepSeek的发展为行业带来了深刻启示:只有满足国产原生模型的算力需求,才能真正推动包含国产算力在内的中国AI产业发展。为全面挖掘国产芯片性能潜力与适配能力,北电数智还推出了“星火·国产算力AI原生适配认证”,促进国产模型与国产算力的深度融合,推动国产芯片在AI原生应用场景中的迭代与创新。
企业版内测上线:助力AI应用落地
目前,北电数智已正式开通企业版内测服务,通过“北京数字经济算力中心”为广大企业和开发者提供便捷、高效的算力支持。无论是模型训练还是推理任务,用户都可以在多芯混元算力环境下轻松构建和部署基于DeepSeek模型的AI应用。
北电数智的一系列举措,为国产AI芯片与模型的协同发展提供了新思路。未来,随着更多企业和开发者加入,国产算力生态也将迎来更加广阔的发展空间。
女子挺5个月孕肚征婚?重庆江北警方通报 中新网1月11日电 据重庆市公安局江北区分局官方微博消息,近日,网传“女子挺5个月孕肚征婚 ”视频,引发网友关注。经查,该女子陈某 (女,33岁,暂住江北区,系自媒体博主) 为吸引流 春节档蝶变:从7亿到80亿,从影院冷清到票房飞驰 在刚刚结束的春节档,电影市场再度创造历史。据灯塔研究院最新发布的《龙腾虎跃,势如破竹――2024年春节档电影市场洞察报告》, 2024年春节档(2月10日-2月17日),全国电 平台数据显示春节中国游客足迹遍布全球1700多个城市 中新社北京2月17日电 (记者 刘亮)中国在线旅游平台去哪儿17日发布的数据显示,今年春节假期中国游客足迹遍布全球115个国家,覆盖全球1754个城市。 据去哪儿 商务部新闻发言人2月22日表示,春节期间,消费市场年味浓、活力足、人气旺,销售较快增长,实现良好开局。预计一季度消费市场将呈现平稳增长态势。春节期间,消费活动丰富多彩。商务部举办全国网上年 新华社记者徐海波、王自宸、宋立崑连日来,湖北省交通运输厅视频调度室里时常灯火通明,各项除雪保畅决策和指令第一时间下发到各路段。20日起,湖北自西向东将出现一轮大范围雨雪冰冻天气,局部地区将出现大 中新经纬2月23日电(罗琨 实习生 徐畅)“中国确实是面向未来的全球技术中心,我很高兴又一次来到中国,在这里进行深入研究。”近日,科勒集团全球首席品牌官赛米・巴尔(Samie Barr)在广州接受中新经纬专访时表示。赛米 。本文链接:北电数智助力DeepSeek与国产芯片适配,加速AI应用落地http://www.sushuapos.com/show-5-47282-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。