DeepSeek的爆火出圈为国产芯片同时带来了机会与挑战。一方面,新锐模型和AI原生应用的爆发会产生更多算力需求,但同时,由于国产芯片在底层架构和软件生态上的差异,如何高效适配AI模型并充分发挥算力潜力成为国产芯片领域亟待解决的问题。
近日,北京电子数智科技有限责任公司(以下简称“北电数智”)依托其“宝塔·模型适配平台”成功完成DeepSeek V3/R1全尺寸模型与海光DCU、华为、壁仞科技、沐曦等多款国产芯片的混元算力适配,为开发者和企业提供了更灵活、高效的算力支持。
技术创新:DeepSeek模型性能领先
DeepSeek模型作为国产AI技术的代表,采用了多项创新技术,包括混合专家系统(DeepSeekMoE)、多头潜在注意力机制(MLA)以及自研训练框架。这使DeepSeek在大幅减少算力开销的情况下实现了R1模型与OpenAI o1相当、V3模型与OpenAI 4o相当的性能表现,展现出高推理效率和低训练成本的优势。
宝塔·模型适配平台:抹平芯片差异,异构算力高效支撑模型
北电数智“宝塔·模型适配平台”抹平了不同芯片架构的差异,快速实现对DeepSeek模型的优化支持和硬件适配。用户无需关注底层硬件技术细节,平台会根据模型调用需求自动匹配合适的算力资源,大幅降低了开发门槛。目前,该平台已完成24款基座大模型的适配工作,为开发者提供了更多算力选择。
混元推理技术:优化效率,降低成本
针对DeepSeek类超大模型的推理任务,数据中心的集群化推理技术显得尤为重要,例如PD分离(Prefill-Decode分离)技术就可由不同芯片完成不同阶段推理任务实现。北电数智的混元推理技术路线与DeepSeek的技术路线高度契合,能有效解决算力不足问题,为大规模AI应用创造便利条件。
推动国产算力发展:从适配到生态建设
DeepSeek的发展为行业带来了深刻启示:只有满足国产原生模型的算力需求,才能真正推动包含国产算力在内的中国AI产业发展。为全面挖掘国产芯片性能潜力与适配能力,北电数智还推出了“星火·国产算力AI原生适配认证”,促进国产模型与国产算力的深度融合,推动国产芯片在AI原生应用场景中的迭代与创新。
企业版内测上线:助力AI应用落地
目前,北电数智已正式开通企业版内测服务,通过“北京数字经济算力中心”为广大企业和开发者提供便捷、高效的算力支持。无论是模型训练还是推理任务,用户都可以在多芯混元算力环境下轻松构建和部署基于DeepSeek模型的AI应用。
北电数智的一系列举措,为国产AI芯片与模型的协同发展提供了新思路。未来,随着更多企业和开发者加入,国产算力生态也将迎来更加广阔的发展空间。
西安碑林博物馆14日起局部开放 门票不分淡旺季每人次10元 中新网西安1月12日电(记者 阿琳娜)记者11日从西安碑林博物馆获悉,该馆自1月10日起采用低票价运行模式,并于1月14日起仅对外开放孔庙古建筑群区域。 (经济观察)花式玩法点亮中国春节旅游市场 中新社北京2月18日电 题:花式玩法点亮中国春节旅游市场 中新社记者 刘文文 餐厅爆满、景区门票售罄、热门酒店“一房难求”……春节假期,中国旅游市场一片红火。 39.5万人次!春节期间上海机场单日旅客吞吐量创下历年春运最高纪录 中新网2月18日电 据上海机场集团微信公众号消息,自2月6日春运出港高峰首日至2月17日(年初八),上海浦东、虹桥机场共保障进出港旅客437.6万人次( 近日,中共中央印发了修订后的《中国共产党巡视工作条例》(以下简称《条例》),并发出通知,要求各地区各部门认真遵照执行。通知指出,《条例》坚持以习近平新时代中国特色社会主义思想为指导,深入贯彻习近 最高检:对未成年人实施网络暴力依法从重处罚 中新网2月23日电 据最高人民检察院微博消息,2月23日,最高人民检察院法律政策研究室主任高景峰在访谈时介绍,对网络暴力违法犯罪,应当体现从严惩治精神,依法严肃追究,切实 中新经纬2月23日电 (王玉玲 刘雪玉)近期,美国开放人工智能研究中心(OpenAI)的文生视频大模型Sora一经推出,就引爆互联网。有业内人士认为,以Sora为首的多模态大模型,将带人类走向更超乎想象的地方。如何看待Sora的发 。本文链接:北电数智助力DeepSeek与国产芯片适配,加速AI应用落地http://www.sushuapos.com/show-5-47282-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。