设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

“源2.0-M32”开源大模型发布

发布时间: 来源: 科技日报

记者6月1日获悉,浪潮电子信息产业股份有限公司近日发布“源2.0-M32”开源大模型。“源2.0-M32”在“源2.0”系列大模型基础上,创新性提出和采用了基于注意力机制的门控网络技术,构建包含32个专家的混合专家模型(MoE),大幅提升了模型算力效率。模型运行时激活参数37亿,在业界主流基准评测中性能全面对标700亿参数的LLaMA3开源大模型。lV7速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

据介绍,针对MoE模型核心的专家调度策略,“源2.0-M32”采用的新型算法结构——基于注意力机制的门控网络,关注专家模型之间的协同性度量,可解决传统门控网络下选择两个或多个专家参与计算时关联性缺失问题,大幅提升专家之间协同处理数据的水平。lV7速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

据悉,“源2.0-M32”以“源2.0-2B”为基础模型设计,沿用并融合局部过滤增强注意力机制。通过“先学习相邻词之间的关联性,再计算全局关联性”的方法,它能更好地学习自然语言的局部和全局语言特征。lV7速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在数据层面,“源2.0-M32”基于超2万亿token(文本中最小的语义单元)进行训练,覆盖万亿量级的代码、中英文书籍、百科、论文及合成数据。在算力层面,“源2.0-M32”为硬件差异较大的训练环境提供了一种高性能训练方法。lV7速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

基于在算法、数据和算力方面的创新,“源2.0-M32”性能大幅提升,在数学竞赛、科学推理榜单上的得分超过700亿参数的LLaMA3开源大模型。lV7速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

浪潮电子信息产业股份有限公司人工智能首席科学家吴韶华表示,大模型在性能不断提升的同时,也面临着所需算力大幅攀升的问题。“源2.0-M32”将为企业开发应用生成式AI提供模型高性能、算力低门槛的高效路径。“‘源2.0-M32’开源大模型配合企业大模型开发平台,将助力企业实现更快的技术迭代与高效的应用落地,为人工智能产业发展提供坚实底座,加速产业智能化进程。”他说。lV7速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

记者6月1日获悉,浪潮电子信息产业股份有限公司近日发布“源2.0-M32”开源大模型。“源2.0-M32”在“源2.0”系列大模型基础上,创新性提出和采用了基于注意力机制的门控网络技术,构建包含32个专家的混合专家模型(MoE),大幅提升了模型算力效率。模型运行时激活参数37亿,在业界主流基准评测中性能全面对标700亿参数的LLaMA3开源大模型。lV7速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

据介绍,针对MoE模型核心的专家调度策略,“源2.0-M32”采用的新型算法结构——基于注意力机制的门控网络,关注专家模型之间的协同性度量,可解决传统门控网络下选择两个或多个专家参与计算时关联性缺失问题,大幅提升专家之间协同处理数据的水平。lV7速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

据悉,“源2.0-M32”以“源2.0-2B”为基础模型设计,沿用并融合局部过滤增强注意力机制。通过“先学习相邻词之间的关联性,再计算全局关联性”的方法,它能更好地学习自然语言的局部和全局语言特征。lV7速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在数据层面,“源2.0-M32”基于超2万亿token(文本中最小的语义单元)进行训练,覆盖万亿量级的代码、中英文书籍、百科、论文及合成数据。在算力层面,“源2.0-M32”为硬件差异较大的训练环境提供了一种高性能训练方法。lV7速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

基于在算法、数据和算力方面的创新,“源2.0-M32”性能大幅提升,在数学竞赛、科学推理榜单上的得分超过700亿参数的LLaMA3开源大模型。lV7速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

浪潮电子信息产业股份有限公司人工智能首席科学家吴韶华表示,大模型在性能不断提升的同时,也面临着所需算力大幅攀升的问题。“源2.0-M32”将为企业开发应用生成式AI提供模型高性能、算力低门槛的高效路径。“‘源2.0-M32’开源大模型配合企业大模型开发平台,将助力企业实现更快的技术迭代与高效的应用落地,为人工智能产业发展提供坚实底座,加速产业智能化进程。”他说。lV7速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

3月18日,记者从山西省人民政府获悉,“山西煤炭工业互联网智算平台”日前在山西联通大数据中心建设完成。该平台由中国联通与山西晋云互联科技有限公司共同打造,是山西省目前唯一的垂直行业类智 3月18日,荣耀在国内市场发布全新AI使能的全场景战略,推出平台级AI赋能、以人为中心的跨操作系统体验,以及与全球产业链共振创新的一系列智能设备。荣耀CEO赵明表示,人工智能大模型时代,他们的AI战 2024年2月,OpenAI公司推出了文生视频人工智能(AI)模型Sora。OpenAI展示了Sora利用少量简短文字提示即可创建逼真视频的能力,并提供了包括一位女士在闪烁着霓虹灯的东京街道漫步,以及一只狗在两个 近日有消息称,huaweiMate60已经停产。作为huawei于2023年8月末发布的最新旗舰机型,huaweiMate60的停产意味着huawei新款旗舰或即将上市,接替Mate60。2023年8月29日,huaweiMate60 Pro、huaweiMate60等 3月23日消息,京东与OPPO战略合作协议签约仪式举行,双方签订未来三年OPPO在京东全渠道实现销售额同比增长100%的目标。在签约仪式上,OPPO高级副CEO、首席产品官刘作虎表示,2024年线上突破是OPPO中国区 记者从中国气象局了解到,3月24日、25日和26日三天,将可能出现地磁活动,其中3月25日可能发生中等以上地磁暴甚至大地磁暴,预计地磁活动将持续到26日。在此影响之下,空间站可能因大气拖拽造成轨道高 。

本文链接:“源2.0-M32”开源大模型发布http://www.sushuapos.com/show-2-6528-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 用人工智能解决心理问题 抑郁状态识别模型准确率达90%

下一篇: 智能云打印破解远程打印难题

热门资讯

  • 量子计算机能更好解决组合优化问题

    旅行推销员问题是一个经典的数学问题,也是一个组合优化问题。德国柏林弗雷大学和亥姆霍兹柏林能源与材料研究中心(HZB)科学家开展的一项新研究证明,量

  • 最小资源消耗的量子态分辨实现

    记者3月20日从中国科学技术大学获悉,该校郭光灿院士团队在量子态分辨研究中取得重要进展:他们在最小资源消耗的量子态分辨问题中首次提出了全局最优

  • 探月工程四期鹊桥二号中继星成功发射

    3月20日8时31分,探月工程四期鹊桥二号中继星由长征八号遥三运载火箭在中国文昌航天发射场成功发射升空。火箭飞行24分钟后,星箭分离,将鹊桥二号中继星

  • 甘肃首座特高压换流站迎来“新成员”

    3月18日,伴随着搬运车的轰鸣声,全国首个大规模清洁能源特高压直流输电工程的送端±800千伏特高压祁连换流站迎来了一位“新成员”—&mdas

  • 世界睡眠日:别让你的良好睡眠被手机夺走

    再打一局游戏就睡,再刷几个视频就睡,终于放下手机,关灯睡觉了……结果翻来覆去睡不着,半夜醒来再也睡不着,为什么明明睡着了,睡眠质量却不高

  • 光储行业迎来2000V新时代

    3月21日,由安徽省工业和信息化厅指导、中国光伏行业协会主办、阳光电源股份有限公司承办的“PAT2024爱光伏一生一世”先进技术研讨会在合肥举办。光

  • 女性比男性更易失眠?什么原因导致?专家分析

    造成女性更容易睡不好的原因是多方面的,包括更年期等生理周期等,而女性长期的失眠除了会导致内分泌进一步失调,还会诱发心脏病、高血压、糖尿病、免疫

  • 单个颗粒无标记光学显微成像实现

    记者3月21日从中国科学技术大学获悉,该校物理学院张斗国教授课题组,提出并实现了一种基于矢量光场调控原理的动量空间偏振滤波器件。该滤波器件安装

  • 饭后想吃零食或因神经元过度活跃

    那些在吃完一顿饱饭后不久就在冰箱里翻找零食的人,可能不是胃口好,而是因为寻找食物的神经元过度活跃的缘故。美国加州大学洛杉矶分校心理学家在老鼠

  • iPhone可能在国内设备使用百度AI技术:集成于iOS 18

    有消息称,iPhone在中国寻找本土生成式AI提供方,iPhone讨论了在中国的设备中使用百度的人工智能技术。据《华尔街日报》报道,iPhone与百度进行了谈判,以授权

  • 为什么有人以为安卓拍照可以打iPhone 答案就这么直接

    聊到安卓电话的拍照,大部分用户还是比较认可的,而在与iPhone电话的对比中,用户也普遍以为安卓电话的拍照水平要比iPhone更好,当然这一说法也并非空穴来风,其

  • 我国网民规模达10.92亿人 互联网普及率达77.5%

    3月22日,中国互联网络信息中心(CNNIC)发布第53次《中国互联网络发展状况统计报告》(以下简称《报告》)。《报告》显示,截至2023年12月,我国网民规模达10.9

推荐资讯

  • 日榜
  • 周榜
  • 月榜