Wap 公众号 评论
设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

岩芯数智董事长陈代千:通用大模型要解决普适性问题,但必须个性化、低能耗

2024-01-26 11:17:53 来源:

21世纪经济报道记者 张赛男 上海报道P9c速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

2023年被公认为是“大模型元年”,国内外大模型层出不穷,堪称“百模大战”。在这场竞赛中,通用大模型、垂直大模型、端侧大模型……各家发布的大模型各有特色,都想从中分一杯羹。P9c速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

2024年开年之际,新的竞争也来临。先是猎豹移动发布猎户星空大模型,后有岩山科技(002195.SZ)旗下岩芯数智推出的自研大模型“Yan模型”……大模型赛道依旧吸引着各路资本的投入。P9c速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

尽管竞争者众多,但市场总会决出最终的赢家,关键是花落谁家?P9c速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

岩山科技常务副总经理、岩芯数智董事长陈代千对21世纪经济报道记者表示:“最终跑出来的大模型一定具有非常好的用户体验。大模型本质上是用户的体验,不管是B端还是C端,最终是用户来评价这个大模型好用不好用。用户体验怎样才能好?首先,要能完成用户给出的任务,如果不能完成任务,谈高效率、低能耗是不现实的。在能完成任务的基础上,以更低能耗和更高效率去完成,客户才会有很强的意愿去复用。”P9c速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

1月24日,岩芯数智发布“Yan模型”,打出的标签是“非Transformer架构”,为国内首个非Attention机制的通用自然语言大模型。在陈代千看来,“Yan模型”去除了Transformer中高成本的注意力机制,代之以计算量更小、难度更低的线性计算,能实现高效率、低能耗的目标。P9c速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Transformer架构或许让普通人感到陌生,但其实是当下爆火的GPT、LLAMA、PaLM等大模型普遍采用的基础架构。凭借着强大的自然语言理解能力,Transformer在问世的短短几年内便取代了传统的RNN网络结构,不仅成为自然语言处理领域的主流模型架构,还在计算机视觉、语音识别等多个领域展示了其跨界的通用能力。P9c速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在Transformer已经占据人工智能领域半壁江山的今天,岩芯数智为何要另辟蹊径?P9c速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

算力和成本是岩芯数智的出发点。岩芯数智CEO刘凡平介绍,以大规模著称的Transformer,在实际应用中的高算力和高成本,让不少中小型企业望而却步。其内部架构的复杂性,让决策过程难以解释;长序列处理困难和无法控制的幻觉问题也限制了大模型在某些关键领域和特殊场景的广泛应用。随着云计算和边缘计算的普及,行业对于高效能、低能耗AI大模型的需求正不断增长。P9c速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“Yan团队早在三年前就已经开始布局、落地非transformer架构相关的事情。在这个过程中,行业也慢慢了解到transformer架构机制有一些共性的缺陷,所以大家都会去研究有没有其他的算法去优化、甚至替代这个结构。”陈代千说,“我们基于此前的实践,确信非transformer的路线是可行的。”P9c速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

陈代千还谈到,“对很多的企业来说,并不是一定要用千亿大模型,用百亿大模型也许就可以达到效果。在千亿大模型上训练成本太高,以至于可能无法快速迭代。我们对通用大模型的理解是,它当然要解决很多普适性的问题,但是它必须个性化、同时必须低能耗。”他还透露,基于Yan架构,仅需投入同等规模Transformer架构成本的50%甚至更低,就可以拥有百万参数级的大模型。P9c速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

那么,这个新架构下的大模型运行效率如何?从岩芯数智给出的对比结果来看,在同等资源条件下,Yan架构的模型,训练效率和推理吞吐量分别是Transformer架构的7倍及5倍,并使记忆能力得到3倍提升。对比数据表明,在单张4090 24G显卡上,当模型输出token的长度超出2600时,Transformer的模型会出现显存不足,而Yan模型的显存使用始终稳定在14G左右,理论上能够实现无限长度的推理。P9c速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在主流架构之外去搭建一个新的系统,岩芯数智显然面临着更大的挑战。P9c速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

当被问及如何看待全新生态系统带来的难度时,岩芯数智CTO杨华对21世纪经济报道记者坦言,“这个点确实会存在,我们从零开始搭建构建自己的生态,确实需要花费更多时间,但也是我们坚信要走的一条路。”P9c速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

他还表示,现在发布的产品是Yan 1.0版本,目前正在做Yan 2.0。“最后的通用人工智能,它肯定不仅仅是现在以语言输入、文本输出等形式,它应该是比如计算机视觉、视频甚至数字信号等全模态的内容都可以输入,然后我的模型也能够以各种形态,比如说以文字吐出、语音合成或者视频、信号处理的方式吐回这个结果。我们想做的Yan 2.0,其实就是往这个方向走,做一个全模态的实时人机交互系统。”P9c速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本文链接:岩芯数智董事长陈代千:通用大模型要解决普适性问题,但必须个性化、低能耗http://www.sushuapos.com/show-2-2395-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 新东方发布超预期财报 俞敏洪回应董宇辉流量超过东方甄选

下一篇: 研究表明土壤压实影响大豆根系“进化”

热门资讯

  • 让肺部磁共振成像从“不可看”到“看得清”

    患者只需吸入特制的“氙气”,3.5秒后一幅人体肺部磁共振3D影像就呈现出来。影像中,气体可抵达肺部的位置清晰可见,患者的肺部微结构、气体交换功能情

  • 监管AI,欧盟出手,美国掉队?

      监管AI,欧盟出手,美国掉队?  上个世纪,科幻小说家艾萨克・阿西莫夫提出了“机器人三定律”,带来了对“机器人”与“规则”的美好幻想。  如今,伴随着ChatGPT、Sora的爆火,

  • AI领域,重磅消息传来!

    AI领域,一则重磅消息传来!最新消息,全球最知名的AI公司——OpenAI将在几个月内发布新版大型语言模型GPT-5,性能将有大幅跃升。目前,ChatGPT使用

  • 人类祖先200万年前开始捕鱼

    美国《发现》杂志网站2月7日刊登题为《200万年前,我们的人类祖先开始从水里捞鱼》的文章,作者是科迪·科蒂尔,内容编译如下:捕鱼可能是一种占许

  • 自主研制!哈工大“天都二号”探月卫星成功发射

    科技日报从哈尔滨工业大学获悉,北京时间2024年3月20日8时31分28秒,“天都一号”“天都二号”通导技术试验星伴随探月工程四期鹊桥二号中继星任务搭乘

  • 科研人员在大别山区发现植物新物种

    据中国科学院武汉植物园消息,我国科研人员在大别山区开展植物多样性科学考察时,发现了天门冬科天门冬属新物种,并将其命名为大别山天门冬。相关研究成

  • 原来,中国空间站里“四季如春”

    春,推也。从草从日,草春时生也。进入春日,人们时常能在大地回暖、万物复苏中见证旺盛的生命力。一起解锁空间站里的“春日关键词”,感受太空中的“春日

  • 新疆筹建国家级融合算力中心

    记者从近日举办的新疆筹建融合算力中心研讨会上获悉,新疆将构建具备国家级算力水平的涵盖超算、智算的融合算力中心。到2024年底,建成超算算力(FP64)不

  • 黑场显微镜让单个颗粒实现无标记光学显微成像

    3月21日记者从中国科学技术大学获悉,该校物理学院张斗国教授课题组,提出并实现了一种基于矢量光场调控原理的动量空间偏振滤波器件。科研人员将该滤

  • 光储行业迎来2000V新时代

    3月21日,由安徽省工业和信息化厅指导、中国光伏行业协会主办、阳光电源股份有限公司承办的“PAT2024爱光伏一生一世”先进技术研讨会在合肥举办。光

  • “婴儿香”原来是真的香

    所谓香喷喷的婴儿,到底是源于人们的爱意,还是说确有其香?《通讯·化学》21日一项小型研究首次分析了婴儿和青少年体味化学组成的差异。研究显示

  • iPhone迈入AI时代!曝国行版苹果 16 AI效果由百度提供

    3月23日消息,据媒体报道,iPhone与百度公司已达成合作协议,百度将为苹果内置的生成式人工智能大模型提供技术支持。报道指出,iPhone生成式人工智能大模型的

推荐资讯

  • 日榜
  • 周榜
  • 月榜