设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

首个全流程国产化类脑脉冲大模型推出

发布时间: 来源: 科技日报

记者8日从中国科学院自动化研究所获悉,来自该所等单位的科研人员首次在国产GPU(图形处理器)算力平台上完成原生类脑脉冲大模型“瞬悉”1.0的全流程训练和推理,并正式开源了70亿参数版本大模型,同时开放了760亿参数版本大模型的测试网址。这是全球首个类脑脉冲大模型,实现了全流程国产化,标志着我国在类脑计算与大模型融合创新方面取得重要突破。U87速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

当前,基于Transformer架构的大模型主要依赖简单“点神经元”与大规模算力提升智能,但其训练和推理成本随文本长度急剧增加,严重制约超长文本处理能力的提升。U87速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在这项研究中,研究团队借鉴大脑神经元的工作机制,提出了一种“基于内生复杂性”的具有线性复杂度的类脑脉冲大模型架构,成功打造出“瞬悉”1.0。“这个模型不仅在理论上揭示了新型计算路径,还构建了适配国产算力的训练推理框架,为构建更高效、更复杂且性能更强的新型大模型开辟了新路径。”中国科学院自动化研究所研究员李国齐说。U87速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

相比传统模型,“瞬悉”1.0展现出四大核心优势:首先,在极低数据量下实现了高效训练,显著提升了长序列训练效率;其次,推理效率得到数量级提升,特别是在超长序列处理上展现出显著优势;再次,构建了国产自主可控的类脑大模型生态,支持将现有Transformer模型高效转换为类脑脉冲架构;最后,设计了多尺度稀疏机制,为低功耗类脑大模型运行提供了有力支撑。U87速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

李国齐表示,这项成果不仅是我国在类脑脉冲大模型架构和国产算力全流程建设上的重大突破,更为法律、医疗、科学模拟等超长序列应用场景提供了更高效的建模工具,也将启迪下一代神经形态计算理论和芯片设计。U87速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

记者8日从中国科学院自动化研究所获悉,来自该所等单位的科研人员首次在国产GPU(图形处理器)算力平台上完成原生类脑脉冲大模型“瞬悉”1.0的全流程训练和推理,并正式开源了70亿参数版本大模型,同时开放了760亿参数版本大模型的测试网址。这是全球首个类脑脉冲大模型,实现了全流程国产化,标志着我国在类脑计算与大模型融合创新方面取得重要突破。U87速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

当前,基于Transformer架构的大模型主要依赖简单“点神经元”与大规模算力提升智能,但其训练和推理成本随文本长度急剧增加,严重制约超长文本处理能力的提升。U87速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在这项研究中,研究团队借鉴大脑神经元的工作机制,提出了一种“基于内生复杂性”的具有线性复杂度的类脑脉冲大模型架构,成功打造出“瞬悉”1.0。“这个模型不仅在理论上揭示了新型计算路径,还构建了适配国产算力的训练推理框架,为构建更高效、更复杂且性能更强的新型大模型开辟了新路径。”中国科学院自动化研究所研究员李国齐说。U87速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

相比传统模型,“瞬悉”1.0展现出四大核心优势:首先,在极低数据量下实现了高效训练,显著提升了长序列训练效率;其次,推理效率得到数量级提升,特别是在超长序列处理上展现出显著优势;再次,构建了国产自主可控的类脑大模型生态,支持将现有Transformer模型高效转换为类脑脉冲架构;最后,设计了多尺度稀疏机制,为低功耗类脑大模型运行提供了有力支撑。U87速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

李国齐表示,这项成果不仅是我国在类脑脉冲大模型架构和国产算力全流程建设上的重大突破,更为法律、医疗、科学模拟等超长序列应用场景提供了更高效的建模工具,也将启迪下一代神经形态计算理论和芯片设计。U87速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

中国科学院深圳先进技术研究院15日发布消息称,该院科研团队研发了一种具有靶向送药功能的磁驱软体机器人,该机器人能够根据器官内部环境的特点选择合适的运动模式,实现靶向送药的同时还可以控制   马斯克开源3140亿参数的Grok,大模型争相开源所为何求?  作者:刘晓洁  特斯拉CEO埃隆・马斯克(Elon Musk)给大模型领域投下一枚重磅炸弹。  北京时间3月18日凌晨,马斯克旗下大模型公司 xAI 在官网宣布开源 3140 3月21日上午,全球首列氢能源市域列车在中车长客股份公司(以下简称“中车长客”)试验线上进行了时速160公里满载运行试验。当日试验过程中,车以160公里/小时速度运行的列车,每公里实际运行平均能耗 瑞士洛桑联邦理工学院工程学院研究团队制造了一种用于内存的新型纳米流体设备,这使他们第一次能连接两个“人工突触”。该设备为受大脑启发的液体硬件设计铺平了道路。这项研究发表在最新一期   “AI热潮”有人欢喜又有人忧:新兴市场遭资金外流!  财联社3月20日讯(编辑 黄君芝)巴西亿万富翁、巴西金融公司Banco BTG Pactual SA创始人Andre Esteves表示,人工智能(AI)股票持续上涨导致发展中国家资本市场资金 科学杂志《成瘾》3月21日发表的一项新研究显示,刚开始吸烟和终生吸烟都可能增加腹部脂肪,特别是内脏脂肪。内脏脂肪与心脏病、糖尿病、中风和痴呆症的高风险有关。吸烟者相较于不吸烟者,通常体 。

本文链接:首个全流程国产化类脑脉冲大模型推出http://www.sushuapos.com/show-2-13684-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 允许AI工具辅助创作,“科幻未来式”北京科幻作品征集启动

下一篇: 平均约11小时新增一家!中国人工智能企业突破5000家

热门资讯

推荐资讯

  • 日榜
  • 周榜
  • 月榜