设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

2024-05-01 20:17:51 来源: 量子位

双雄格局呼之欲出bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型,已经开启大卷特卷模式。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

全球范围,太平洋两岸,双雄格局正在呼之欲出。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Llama 3中杯大杯刚惊艳亮相,国内通义千问就直接开源千亿级参数模型Qwen1.5-110B,一把火上Hacker News榜首。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

不仅相较于自家720亿参数模型性能明显提升,在MMLU、C-Eval、HumanEval等多个基准测试中,Qwen1.5-110B都重返SOTA开源模型宝座,超越Llama 3 70B,成最强开源大模型bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

中文能力方面,对比仅喂了5%非英文数据的Llama 3 70B,Qwen1.5-110B更是优势明显。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

于是乎,模型一上线,开源社区已经热烈响应起来。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这不,Qwen1.5-110B推出不到一天,帮助用户在本地环境运行创建大语言模型的Ollama平台,就已火速上线链接。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

值得关注的是,这已经是3个月内通义千问开源的第8款大模型bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型都在卷些什么?

那么,问题来了,因Llama 3和Qwen1.5接连开源而持续的这波开源大模型小热潮中,开源模型又在卷些什么?bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

如果说上一阶段由马斯克Grok和Mixtral所引领的话题热点是MoE,那网友们这一两周内聚焦的第一关键词,当属Scaling Laws——bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

尺度定律

OpenAI创始成员、前特斯拉AI总监Andrej Karpathy在总结Llama 3时,就着重提到过其中尺度定律的体现:bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Llama 2在2T token数据上训练,而Llama 3直接加码到了15T,远超Chinchilla推荐量。并且Meta提到,即便如此,模型似乎依然没有以标准方式“收敛”。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

也就是说,“力大砖飞”这事儿还远没有达到上限。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

无独有偶,Qwen1.5-110B延续了这个话题的讨论。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

官方博客提到,相比于Qwen1.5-72B,此次开源的千亿参数模型在预训练方法上并没有太大的改变,但包括编程、数学、语言理解、推理在内的各项能力提升明显。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

更强大、更大规模的基础语言模型,也带来了更好的Chat模型。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

阿里的研究人员们指出,Qwen1.5-110B的评测成绩意味着,在模型大小扩展方面仍有很大的提升空间。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

官方还浅浅剧透了Qwen 2的研究方向:同时扩展训练数据和模型大小,双管齐下。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

多语言和长文本能力bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

尺度定律之外,由闭源模型掀起的长文本风潮,同样在开源模型身上被重点关注。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Llama 3的8K上下文窗口,就遭到了不少吐槽:实在有点“古典”。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Qwen1.5-110B在这方面延续了同系列模型的32K上下文。在此前的测试中,长文本能力测试结果显示,即使是Qwen1.5-7B这样的“小模型”,也能表现出与GPT3.5-turbo-16k类似的性能。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

并且,开源的优势就是敢想你就来。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

Qwen1.5官方博客中提到,虽然纸面给的是32K吧,但并不代表模型的上限就到这儿了:bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

另一个由通义千问而被cue到的大模型能力评判指标,就是多语言能力。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

以Qwen1.5-110B为例,该模型支持中文、英文、法语、西班牙语、德语、俄语、韩语、日语、越南语、阿拉伯语等多种语言。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

阿里高级算法专家林俊旸分享过通义千问团队内部收到的反馈:实际上,多语言能力在全球开源社区中广受欢迎,正在推动大模型在全球各地的落地应用。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而Qwen1.5在12个比较大的语言中,表现都不逊于GPT-3.5。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

对于中文世界而言,这也是国产开源大模型的优势所在。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

毕竟Llama 3强则强矣,训练数据方面中文语料占比实在太少(95%都是英文数据),单就中文能力而言,确实没法儿拿来即用。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

相比之下,Qwen1.5 110B的中文实力就靠谱多了。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

能让歪果仁瞬间抓狂的中文水平测试,轻松拿捏:bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

弱智吧Benchmark,也能应对自如:bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

此外,还有不少网友提到了开源模型型号丰富度的问题。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

以Qwen1.5为例,推出不到3个月,已经连续开源8款大语言模型,参数规模涵盖5亿、18亿、40亿、70亿、140亿、320亿、720亿和1100亿,还推出了代码模型CodeQwen1.5-7B,和混合专家模型Qwen1.5-MoE-A2.7B。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

随着大模型应用探索的不断深入,业界已经逐渐达成新的共识:在许多具体的任务场景中,“小”模型比“大”模型更实用。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而随着大模型应用向端侧的转移,丰富、全面的不同型号开源模型,无疑给开发者们带来了更多的选择。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“把开源进行到底”bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

如同大洋彼岸OpenAI引领闭源模型发展,而Meta靠开放权重的Llama系列另辟蹊径,在国内,阿里正是大厂中对开源大模型态度最积极的一家。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

从Qwen到Qwen1.5,再到多模态的Qwen-VL和Qwen-Audio,通义千问自去年以来可谓开源消息不断。仅Qwen1.5系列,目前累计已开源10款大模型。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

阿里官方,也已直接亮明“把开源进行到底”的态度。这在卷大模型的互联网大厂中,确实是独一份。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

所以,阿里坚持走开源路线,背后的底层逻辑是什么?bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

或许可以拆解为以下几个层面来分析。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

首先,在技术层面,尽管以GPT系列、Claude系列为代表的闭源模型们目前占据着领先地位,但开源模型也“步步紧逼”,不断有新进展惊艳科技圈。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

图灵奖得主Yann LeCun就曾援引ARK Invest的数据认为“开源模型正走在超越闭源模型的道路上”。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

ARK Invest当时预测,在2024年,开源模型会对闭源模型的商业模式构成挑战。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而随着Llama 3为标杆的新一波开源大模型的爆发,越来越多的业内专家也开始期待,强大的开源模型“会改变很多学界研究和初创公司的发展方式”。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

值得一提的是,开源模型独特的一重优势在于,来自开源社区的技术力量,同时也反哺了开源大模型的发展。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

林俊旸就在量子位AIGC产业峰会上分享过,通义千问32B的开源,就是在因开发者们的反馈而推动的。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

其次,在应用落地层面,开源大模型无疑起到了加速器的作用。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源社区的热情就侧面佐证了开发者们把基础模型的控制权把握在自己手中的倾向性。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

以通义千问为例,在HuggingFace、魔搭社区的下载量已经超过700万。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

更实际的落地案例,也正在各行各业中持续实现。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

比如,中国科学院国家天文台人工智能组,就基于通义千问开源模型,开发了新一代天文大模型“星语3.0”,将大模型首次应用于天文观测领域。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

而对于推动开源的企业而言,打响的也不仅仅是名气和在开发者社区中的影响力。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

通义千问的B端业务,也正因开源而加速。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

最新消息是,通义大模型不仅“上天”,现在还“下矿”了。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

继西部机场集团推出基于阿里云通义大模型打造的首个航空大模型后,西安塔力科技通过接入阿里云通义大模型,打造了新型矿山重大风险识别处置系统,并已在陕煤建新煤矿等十余座矿山上线,这是大模型在矿山场景的首次规模化落地。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

目前,新东方、同程旅行、长安汽车、亲宝宝等多家企业均已宣布介入通义大模型。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

轰轰烈烈的百模大战硝烟渐散,当人们开始讨论闭源模型格局初定时,2024年,不得不说开源大模型给整个技术圈带来了不少新的惊喜。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而随着大模型应用开始成为新阶段探索的主旋律,站在开发者、初创企业、更多非互联网企业的角度而言,以Llama、通义千问等为代表的开源大模型越强,垂直行业结合做行业大模型的自由度就会越高,落地速度也会越快。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

过去互联网的繁荣建立在开源的基础之上,而现在,在大模型风暴中,开源大模型再次显现出鲶鱼效应。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

自研大模型的必要性和竞争力,正在不断被开源卷王们卷没了。bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

— 完 —bQk速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本文链接:开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型http://www.sushuapos.com/show-2-5573-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 小红书让智能体们吵起来了!联合复旦推出大模型专属群聊工具

下一篇: 2024全球机器学习技术大会上海站圆满闭幕,共奏AGI变革新时代

热门资讯

  • “桃花癫”是种病,得治

    民俗有言:桃花开,痴子忙。昨日,一大学生患“桃花癫”登上微博热搜,引发热议。该大学生认为周围女生都喜欢自己,并向全校的女生分别告白。不仅如此,由于精

  • 洞悉竹类植物有了称手“利器”

    竹类植物是竹亚科植物的总称,与水稻、小麦、大麦和燕麦同属于禾本科BOP分支,具有重要的经济、生态和文化价值。为更好地服务竹类植物的系统进化和功

  • 全国爱肝日丨专家提醒注意“小心肝”

    3月18日是第24个“全国爱肝日”。今年活动的主题是,“早防早筛,远离肝硬化”。重庆多所医院开展义诊咨询活动,通过普及肝病的防治知识,让民众主动筛查

  • 数字化管理已在故宫广泛应用

    在今天的故宫,工作人员使用的数字化办公平台名叫“内务辅”,这款应用的开发者,是与故宫博物院合作的钉钉(中国)信息技术有限公司(以下简称“钉钉”)。3月1

  • 活性氧响应性材料 向肠炎部位精准投药

    3月17日,记者从陆军军医大学西南医院获悉,该院消化内科教授陈磊团队联合陆军军医大学教授张定林首次提出,活性氧响应性纳米材料能够把程序性死亡配体-

  • 多功能金纳米花颗粒 可促进感染性组织修复

    3月17日,记者从海南大学获悉,该校化学化工学院副教授李萌婷与相关研究团队合作,合成了多功能复合金纳米花颗粒。该颗粒配合温和光热、光动力、药物控

  • 我国科学家揭示东北黑土成因

    记者3月20日从中国科学院地质与地球物理研究所获悉,该所科研人员在东北黑土区开展了大范围的野外调查和样品采集工作,通过分析采集的黑土样品发现,黑

  • 来看金星土星“亲密一刻”

    3月22日黎明,太阳系中最明亮的行星金星与太阳系中拥有最多卫星的行星土星将在东南方低空近距离相伴,上演“结伴游”。北京星空摄影爱好者王俊峰2023

  • 被美国诉讼垄断:iPhone回应想让苹果变成安卓!iOS开放还怎么玩

    3月22日消息,美国司法部对iPhone提起诉讼,声称其苹果生态系统构成垄断。司法部表示,iPhone将苹果生态系统视为一种垄断,以牺牲消费者、开发者和竞争对手的

  • 首批量子测量领域国家标准发布

    随着量子技术的发展,利用量子特性突破传统测量技术极限的新一代精密测量技术——量子测量开始得到应用。记者从中国计量科学研究院获悉,由

  • “捕风捉光”,气象服务助力新能源发电

    今年3月23日是第64个世界气象日,主题是“气候行动最前线”。面对愈加频繁的极端天气和全球变暖等气候危机,减缓气候变化已刻不容缓。发展新能源是应

  • 诺基亚手机“掉队”带来的启示

    作为功能机时代的霸主,诺基亚手机曾经创造了巨大的辉煌,但也因错失智能手机发展机遇而“掉队”。近期,外媒Visual Capitalist统计了有史以来最畅销的1

推荐资讯

  • 日榜
  • 周榜
  • 月榜