9月18日,华为全联接大会2025在上海开幕。会上,浙江大学与华为技术有限公司联合发布了国内首个基于昇腾千卡算力平台的DeepSeek-R1-Safe基础大模型。中国工程院院士陈纯、华为昇腾计算业务总裁张迪煊等出席见证该模型的发布并发言。
发布仪式。华为 供图
陈纯对DeepSeek-R1-Safe基础大模型发布表示祝贺。他指出,此次DeepSeek-R1-Safe的发布旨在打造安全可信的示范应用,推动大模型安全能力与产业生态协同发展。目前,浙江大学计算机科学与技术学院已组建起一支涵盖多位海内外优秀青年人才的科研团队,并已依托昇腾生态实现了自主全流程后训练框架,完成了国内首次千卡集群大模型安全训练,希望团队未来与华为展开更深入合作,共同推动我国AI技术进步。
张迪煊表示,华为近年来持续加大研发投入,突破多项关键核心技术,在硬件与产业生态建设方面取得了一系列成果。在华为全联接大会2025上,华为推出了昇腾新一代AI硬件与全系列软件开源开放战略,致力于通过深度开放协作,联合高校与产业伙伴共同推动基础软件创新与AI安全能力建设。他相信,与浙江大学的紧密合作将有助于进一步增强源头创新能力,共同筑牢安全、可信、有竞争力的AI产业生态。
浙江大学计算机科学与技术学院院长、区块链与数据安全全国重点实验室常务副主任任奎详细介绍了DeepSeek-R1-Safe-671B基础大模型的核心创新。他说,研发团队从底层入手,构建了一套覆盖“高质量安全语料—平衡优化的安全训练—全链路自主创新软硬件平台”的全流程安全后训练框架。在算力平台搭建方面,团队首次实现基于昇腾千卡算力平台的千亿级参数满血版大模型安全训练,系统性地解决了训练环境中的关键问题,构建了服务器间环境依赖同步、数据与权重共享、协同训练推理等一系列开发工具。
任奎称,测试结果显示,DeepSeek-R1-Safe针对有毒有害言论、政治敏感内容、违法行为教唆等14个维度的普通有害问题整体防御成功率近100%,针对情境假设、角色扮演、加密编码等多个越狱模式整体防御成功率超过40%,其综合安全防御能力达83%,在同样测试设置下超过多个同期模型8%至15%。这些结果表明DeepSeek-R1-Safe不仅显著提升了安全防护能力,也保障了模型的可用性,达成了安全能力与通用性能之间的有效平衡。
目前,模型已在ModelZoo、GitCode、GitHub、Gitee及ModelScope等多个社区全面开源。
12月16日,2023科技伦理高峰论坛在复旦大学成功举办。来自中国科协及海内外知名高校、科研机构的150多位专家学者汇聚一堂 在庞大的维生素家族中,最为人所熟悉的恐怕就是维生素C了。 作为人体必需的维生素之一,维生素C因其具有的超强抗氧化 12月16日,纪念姜维壮教授诞辰百年学术研讨会暨中国财税史研究院2023年年会在中央财经大学召开。在会上,与会者深切缅怀我 美国哈佛大学校长克洛迪娜·盖伊当地时间1月2日发表声明,宣布辞去哈佛大学校长一职。 盖伊在声明中说,她 如果说起这两年印度蹿升最猛的高校,那无疑应包括萨维塔医学和技术科学研究所(SIMATS)。 其所属牙科学院以一己之力,累计发表 今天(1月3日),位于河北保定的亚洲最大自然博物馆之一——中国古动物馆(保定自然博物馆)正式开馆。 △中国 。本文链接:兼顾AI安全与性能,这款基础大模型问世http://www.sushuapos.com/show-11-26215-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
上一篇: 庆祝中华医学会成立110周年大会在京举行
下一篇: 十字花科作物根肿病防治获突破