DeepSeek的爆火出圈为国产芯片同时带来了机会与挑战。一方面,新锐模型和AI原生应用的爆发会产生更多算力需求,但同时,由于国产芯片在底层架构和软件生态上的差异,如何高效适配AI模型并充分发挥算力潜力成为国产芯片领域亟待解决的问题。
近日,北京电子数智科技有限责任公司(以下简称“北电数智”)依托其“宝塔·模型适配平台”成功完成DeepSeek V3/R1全尺寸模型与海光DCU、华为、壁仞科技、沐曦等多款国产芯片的混元算力适配,为开发者和企业提供了更灵活、高效的算力支持。
技术创新:DeepSeek模型性能领先
DeepSeek模型作为国产AI技术的代表,采用了多项创新技术,包括混合专家系统(DeepSeekMoE)、多头潜在注意力机制(MLA)以及自研训练框架。这使DeepSeek在大幅减少算力开销的情况下实现了R1模型与OpenAI o1相当、V3模型与OpenAI 4o相当的性能表现,展现出高推理效率和低训练成本的优势。
宝塔·模型适配平台:抹平芯片差异,异构算力高效支撑模型
北电数智“宝塔·模型适配平台”抹平了不同芯片架构的差异,快速实现对DeepSeek模型的优化支持和硬件适配。用户无需关注底层硬件技术细节,平台会根据模型调用需求自动匹配合适的算力资源,大幅降低了开发门槛。目前,该平台已完成24款基座大模型的适配工作,为开发者提供了更多算力选择。
混元推理技术:优化效率,降低成本
针对DeepSeek类超大模型的推理任务,数据中心的集群化推理技术显得尤为重要,例如PD分离(Prefill-Decode分离)技术就可由不同芯片完成不同阶段推理任务实现。北电数智的混元推理技术路线与DeepSeek的技术路线高度契合,能有效解决算力不足问题,为大规模AI应用创造便利条件。
推动国产算力发展:从适配到生态建设
DeepSeek的发展为行业带来了深刻启示:只有满足国产原生模型的算力需求,才能真正推动包含国产算力在内的中国AI产业发展。为全面挖掘国产芯片性能潜力与适配能力,北电数智还推出了“星火·国产算力AI原生适配认证”,促进国产模型与国产算力的深度融合,推动国产芯片在AI原生应用场景中的迭代与创新。
企业版内测上线:助力AI应用落地
目前,北电数智已正式开通企业版内测服务,通过“北京数字经济算力中心”为广大企业和开发者提供便捷、高效的算力支持。无论是模型训练还是推理任务,用户都可以在多芯混元算力环境下轻松构建和部署基于DeepSeek模型的AI应用。
北电数智的一系列举措,为国产AI芯片与模型的协同发展提供了新思路。未来,随着更多企业和开发者加入,国产算力生态也将迎来更加广阔的发展空间。
春节假期北京接待游客1749.5万人次 旅游市场热度攀升 中新网北京2月18日电 (记者 徐婧)记者17日从北京市文化和旅游局获悉,春节假期(2月10日至17日),北京接待游客1749.5万人次,按可比口径同比增长37.4%,比2019年同 新华社记者戴小河与年前寒潮相比,龙年的第一轮寒潮降温幅度更大、低温持续时间更长、冻雨影响范围更广、南方降雨更强。多地气温“俯冲式”下跌,供暖供电需求攀升。煤、电、气等能源行业积极应对,全天候 中国经济导报 中国发展网讯 春风送暖促就业、精准服务助发展。2月21日,甘肃礼县举行2024年春风行动·东西部劳务协作招聘会暨“礼贤妹”“礼贤大嫂”赴京务工欢送仪式,来自省内外26家人力资源服 2月电影票房破100亿,传媒板块多股涨停,行业有望持续繁荣 2月23日,传媒板块盘中持续走强,截至发稿,宣亚国际20%涨停,赛因集团涨超19%,文投控股、天威视讯、中视传媒等多股涨停,川网传媒、百纳千成涨超8%。 消息上,据 实习期“双向侵权”如何破解? 劳动时间长,拿到的报酬却很微薄;实习岗位上受了伤,无法获得工伤赔偿……权益受侵害难维权,让职校生实习遭受到多方诟病。与此同时,用心培养后很难留住优秀实习生,付出的人力物力“竹 激活公共数据要素潜能 日前,国家数据局等部门发布《“数据要素×”三年行动计划(2024―2026年)》,进一步明确和细化了激活数据要素潜能的具体方式和实践场景,扩展数据要素的高质量供给。将通过多领域、多行业的试 。本文链接:北电数智助力DeepSeek与国产芯片适配,加速AI应用落地http://www.sushuapos.com/show-5-47282-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。