兼顾AI安全与性能，这款基础大模型问世

发布时间: 2025-09-19 17:58:53 来源：中国科学报

观看：75

9月18日，华为全联接大会2025在上海开幕。会上，浙江大学与华为技术有限公司联合发布了国内首个基于昇腾千卡算力平台的DeepSeek-R1-Safe基础大模型。中国工程院院士陈纯、华为昇腾计算业务总裁张迪煊等出席见证该模型的发布并发言。

发布仪式。华为供图

陈纯对DeepSeek-R1-Safe基础大模型发布表示祝贺。他指出，此次DeepSeek-R1-Safe的发布旨在打造安全可信的示范应用，推动大模型安全能力与产业生态协同发展。目前，浙江大学计算机科学与技术学院已组建起一支涵盖多位海内外优秀青年人才的科研团队，并已依托昇腾生态实现了自主全流程后训练框架，完成了国内首次千卡集群大模型安全训练，希望团队未来与华为展开更深入合作，共同推动我国AI技术进步。

张迪煊表示，华为近年来持续加大研发投入，突破多项关键核心技术，在硬件与产业生态建设方面取得了一系列成果。在华为全联接大会2025上，华为推出了昇腾新一代AI硬件与全系列软件开源开放战略，致力于通过深度开放协作，联合高校与产业伙伴共同推动基础软件创新与AI安全能力建设。他相信，与浙江大学的紧密合作将有助于进一步增强源头创新能力，共同筑牢安全、可信、有竞争力的AI产业生态。

浙江大学计算机科学与技术学院院长、区块链与数据安全全国重点实验室常务副主任任奎详细介绍了DeepSeek-R1-Safe-671B基础大模型的核心创新。他说，研发团队从底层入手，构建了一套覆盖“高质量安全语料—平衡优化的安全训练—全链路自主创新软硬件平台”的全流程安全后训练框架。在算力平台搭建方面，团队首次实现基于昇腾千卡算力平台的千亿级参数满血版大模型安全训练，系统性地解决了训练环境中的关键问题，构建了服务器间环境依赖同步、数据与权重共享、协同训练推理等一系列开发工具。

任奎称，测试结果显示，DeepSeek-R1-Safe针对有毒有害言论、政治敏感内容、违法行为教唆等14个维度的普通有害问题整体防御成功率近100%，针对情境假设、角色扮演、加密编码等多个越狱模式整体防御成功率超过40%，其综合安全防御能力达83%，在同样测试设置下超过多个同期模型8%至15%。这些结果表明DeepSeek-R1-Safe不仅显著提升了安全防护能力，也保障了模型的可用性，达成了安全能力与通用性能之间的有效平衡。

目前，模型已在ModelZoo、GitCode、GitHub、Gitee及ModelScope等多个社区全面开源。

近日，四川农业大学动物医学院猪病研究中心黄小波课题组在自然指数（Nature index）期刊Journal of Biological Chemistry发表就在ChatGPT推出一周年前夕，其开发机构OpenAI经历了一场令人瞠目的高层“地震”。联合创始人之一的首席科学家伊利亚欧洲空间局公布了“欧几里德”空间望远镜拍摄的首批彩色图像，有助于揭示暗物质和暗能量等宇宙奥秘。图为马头星云的中新社北京1月1日电 (记者阮煜琳)中国自然资源部海啸预警中心消息，日本本州西岸近海海域1月1日发生7.4级地震已引发近日，日本政府批准了一项立法，要求6所顶尖大学成立新的管理政策委员会，使外部专家在决策中有更大的发言权。据《科上海海事大学近日召开干部大会，宣读市委决定：初北平同志任上海海事大学党委副书记、校长。上海海事大学官网图 2024年1 。

本文链接：兼顾AI安全与性能，这款基础大模型问世http://www.sushuapos.com/show-11-26215-0.html

声明：本网站为非营利性网站，本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：庆祝中华医学会成立110周年大会在京举行

下一篇：十字花科作物根肿病防治获突破

兼顾AI安全与性能，这款基础大模型问世

热门资讯

推荐资讯

科学最热文章