设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

发布时间: 来源: 量子位

双雄格局呼之欲出JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型,已经开启大卷特卷模式。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

全球范围,太平洋两岸,双雄格局正在呼之欲出。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Llama 3中杯大杯刚惊艳亮相,国内通义千问就直接开源千亿级参数模型Qwen1.5-110B,一把火上Hacker News榜首。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

不仅相较于自家720亿参数模型性能明显提升,在MMLU、C-Eval、HumanEval等多个基准测试中,Qwen1.5-110B都重返SOTA开源模型宝座,超越Llama 3 70B,成最强开源大模型JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

中文能力方面,对比仅喂了5%非英文数据的Llama 3 70B,Qwen1.5-110B更是优势明显。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

于是乎,模型一上线,开源社区已经热烈响应起来。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这不,Qwen1.5-110B推出不到一天,帮助用户在本地环境运行创建大语言模型的Ollama平台,就已火速上线链接。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

值得关注的是,这已经是3个月内通义千问开源的第8款大模型JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型都在卷些什么?

那么,问题来了,因Llama 3和Qwen1.5接连开源而持续的这波开源大模型小热潮中,开源模型又在卷些什么?JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

如果说上一阶段由马斯克Grok和Mixtral所引领的话题热点是MoE,那网友们这一两周内聚焦的第一关键词,当属Scaling Laws——JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

尺度定律

OpenAI创始成员、前特斯拉AI总监Andrej Karpathy在总结Llama 3时,就着重提到过其中尺度定律的体现:JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Llama 2在2T token数据上训练,而Llama 3直接加码到了15T,远超Chinchilla推荐量。并且Meta提到,即便如此,模型似乎依然没有以标准方式“收敛”。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

也就是说,“力大砖飞”这事儿还远没有达到上限。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

无独有偶,Qwen1.5-110B延续了这个话题的讨论。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

官方博客提到,相比于Qwen1.5-72B,此次开源的千亿参数模型在预训练方法上并没有太大的改变,但包括编程、数学、语言理解、推理在内的各项能力提升明显。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

更强大、更大规模的基础语言模型,也带来了更好的Chat模型。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

阿里的研究人员们指出,Qwen1.5-110B的评测成绩意味着,在模型大小扩展方面仍有很大的提升空间。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

官方还浅浅剧透了Qwen 2的研究方向:同时扩展训练数据和模型大小,双管齐下。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

多语言和长文本能力JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

尺度定律之外,由闭源模型掀起的长文本风潮,同样在开源模型身上被重点关注。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Llama 3的8K上下文窗口,就遭到了不少吐槽:实在有点“古典”。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Qwen1.5-110B在这方面延续了同系列模型的32K上下文。在此前的测试中,长文本能力测试结果显示,即使是Qwen1.5-7B这样的“小模型”,也能表现出与GPT3.5-turbo-16k类似的性能。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

并且,开源的优势就是敢想你就来。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

Qwen1.5官方博客中提到,虽然纸面给的是32K吧,但并不代表模型的上限就到这儿了:JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

另一个由通义千问而被cue到的大模型能力评判指标,就是多语言能力。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

以Qwen1.5-110B为例,该模型支持中文、英文、法语、西班牙语、德语、俄语、韩语、日语、越南语、阿拉伯语等多种语言。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

阿里高级算法专家林俊旸分享过通义千问团队内部收到的反馈:实际上,多语言能力在全球开源社区中广受欢迎,正在推动大模型在全球各地的落地应用。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而Qwen1.5在12个比较大的语言中,表现都不逊于GPT-3.5。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

对于中文世界而言,这也是国产开源大模型的优势所在。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

毕竟Llama 3强则强矣,训练数据方面中文语料占比实在太少(95%都是英文数据),单就中文能力而言,确实没法儿拿来即用。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

相比之下,Qwen1.5 110B的中文实力就靠谱多了。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

能让歪果仁瞬间抓狂的中文水平测试,轻松拿捏:JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

弱智吧Benchmark,也能应对自如:JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

此外,还有不少网友提到了开源模型型号丰富度的问题。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

以Qwen1.5为例,推出不到3个月,已经连续开源8款大语言模型,参数规模涵盖5亿、18亿、40亿、70亿、140亿、320亿、720亿和1100亿,还推出了代码模型CodeQwen1.5-7B,和混合专家模型Qwen1.5-MoE-A2.7B。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

随着大模型应用探索的不断深入,业界已经逐渐达成新的共识:在许多具体的任务场景中,“小”模型比“大”模型更实用。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而随着大模型应用向端侧的转移,丰富、全面的不同型号开源模型,无疑给开发者们带来了更多的选择。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“把开源进行到底”JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

如同大洋彼岸OpenAI引领闭源模型发展,而Meta靠开放权重的Llama系列另辟蹊径,在国内,阿里正是大厂中对开源大模型态度最积极的一家。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

从Qwen到Qwen1.5,再到多模态的Qwen-VL和Qwen-Audio,通义千问自去年以来可谓开源消息不断。仅Qwen1.5系列,目前累计已开源10款大模型。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

阿里官方,也已直接亮明“把开源进行到底”的态度。这在卷大模型的互联网大厂中,确实是独一份。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

所以,阿里坚持走开源路线,背后的底层逻辑是什么?JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

或许可以拆解为以下几个层面来分析。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

首先,在技术层面,尽管以GPT系列、Claude系列为代表的闭源模型们目前占据着领先地位,但开源模型也“步步紧逼”,不断有新进展惊艳科技圈。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

图灵奖得主Yann LeCun就曾援引ARK Invest的数据认为“开源模型正走在超越闭源模型的道路上”。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

ARK Invest当时预测,在2024年,开源模型会对闭源模型的商业模式构成挑战。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而随着Llama 3为标杆的新一波开源大模型的爆发,越来越多的业内专家也开始期待,强大的开源模型“会改变很多学界研究和初创公司的发展方式”。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

值得一提的是,开源模型独特的一重优势在于,来自开源社区的技术力量,同时也反哺了开源大模型的发展。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

林俊旸就在量子位AIGC产业峰会上分享过,通义千问32B的开源,就是在因开发者们的反馈而推动的。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

其次,在应用落地层面,开源大模型无疑起到了加速器的作用。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源社区的热情就侧面佐证了开发者们把基础模型的控制权把握在自己手中的倾向性。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

以通义千问为例,在HuggingFace、魔搭社区的下载量已经超过700万。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

更实际的落地案例,也正在各行各业中持续实现。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

比如,中国科学院国家天文台人工智能组,就基于通义千问开源模型,开发了新一代天文大模型“星语3.0”,将大模型首次应用于天文观测领域。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

而对于推动开源的企业而言,打响的也不仅仅是名气和在开发者社区中的影响力。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

通义千问的B端业务,也正因开源而加速。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

最新消息是,通义大模型不仅“上天”,现在还“下矿”了。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

继西部机场集团推出基于阿里云通义大模型打造的首个航空大模型后,西安塔力科技通过接入阿里云通义大模型,打造了新型矿山重大风险识别处置系统,并已在陕煤建新煤矿等十余座矿山上线,这是大模型在矿山场景的首次规模化落地。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

目前,新东方、同程旅行、长安汽车、亲宝宝等多家企业均已宣布介入通义大模型。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型

轰轰烈烈的百模大战硝烟渐散,当人们开始讨论闭源模型格局初定时,2024年,不得不说开源大模型给整个技术圈带来了不少新的惊喜。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而随着大模型应用开始成为新阶段探索的主旋律,站在开发者、初创企业、更多非互联网企业的角度而言,以Llama、通义千问等为代表的开源大模型越强,垂直行业结合做行业大模型的自由度就会越高,落地速度也会越快。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

过去互联网的繁荣建立在开源的基础之上,而现在,在大模型风暴中,开源大模型再次显现出鲶鱼效应。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

自研大模型的必要性和竞争力,正在不断被开源卷王们卷没了。JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

— 完 —JXY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“当时是怎样选中低空经济这个领域,并且来深圳发展的?”面对这个关乎事业发展的问题,“95后”台青张晏纶坦言,“这是一场面试带来的惊喜。”张晏纶来自台湾台中市,本科就读于台湾成功大学机械工程 记者3月20日从中国科学院地质与地球物理研究所获悉,该所科研人员在东北黑土区开展了大范围的野外调查和样品采集工作,通过分析采集的黑土样品发现,黑土物质最初都是由风力搬运而来。相关研究成 3月21日是世界睡眠日,中国主题为“健康睡眠 人人共享”。近日发布的《2023年中国居民睡眠白皮书》显示,我国居民平均睡眠时长6.75小时,平均在零点后入睡,夜间睡眠时长普遍偏短。你是否有睡眠困扰 记者3月20日从中国科学技术大学获悉,该校郭光灿院士团队在量子态分辨研究中取得重要进展。研究组在最小资源消耗的量子态分辨问题中首次提出了全局最优自适应策略,并发展了自适应集体测量实验 中国气象局下一代大气数值模式日前发布。该模式采用完全自主的动力框架算法——多矩约束有限体积方法为基础算法,进一步提升全球公里级和区域百米级尺度数值预报的精度,显著减小全球 聊到安卓电话的拍照,大部分用户还是比较认可的,而在与iPhone电话的对比中,用户也普遍以为安卓电话的拍照水平要比iPhone更好,当然这一说法也并非空穴来风,其背后的原因直接而明确。首先,硬件配置的竞争 。

本文链接:开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型http://www.sushuapos.com/show-2-5573-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 小红书让智能体们吵起来了!联合复旦推出大模型专属群聊工具

下一篇: 2024全球机器学习技术大会上海站圆满闭幕,共奏AGI变革新时代

热门资讯

推荐资讯

  • 1元一包的干脆面,一年卖了近5亿!

      中新经纬3月27日电 (闫淑鑫)近日,康师傅控股(下称康师傅)发布2025年年报,实现收入790.68亿元(人民币,下同),同比下滑2.0%;实现股东应占溢利45亿元,同比增长20.5%;毛利率同比增

  • 创业板指半日涨0.83% 创新药概念多股涨停

      中新经纬3月27日电 周五早盘,A股三大指数低开高走。截至午间收盘,上证指数涨0.26%,报3899.12点;深证成指涨0.93%,报13732.34点;创业板指涨0.83%,报3299.57点。  沪深两市半日

  • 确保续签,挽留!乐华娱乐拟向王一博授予1250万股股份

      中新经纬3月26日电 3月25日晚,港股上市公司乐华娱乐公告,拟向王一博授予1250万股股份。  公告显示,乐华娱乐建议,根据2026年股份激励计划,向公司服务供应商王一博授出合共

  • 国家市场监管总局:加大网络食品监管执法力度

      中新经纬3月26日电 据“市说新语”微信号26日消息,近日,市场监管总局召开网络平台食品安全行政指导会,进一步压实网络平台主体责任,落实落细管控措施,着力营造安全放心的网络

  • 商务部:进口更多国外优质商品、技术和服务

      中新经纬3月26日电 商务部新闻发言人何咏前26日表示,商务部将充分发挥平台作用,办好进博会等重要展会,扩大“出口中国”品牌影响力,强化精准对接,发挥各方优势,进口更多国外优

  • 德邦股份3月31日终止上市

      中新经纬3月25日电 德邦股份25日晚间公告,上海证券交易所于2026年3月24日作出公司股票终止上市的决定,公司股票将于2026年3月31日终止上市暨摘牌。  德邦股份称,根据《上

  • 2年、5年和10年,人形机器人的“ChatGPT时刻”何时到来?

      中新经纬3月25日电 (薛宇飞 王玉玲)“你们觉得人形机器人的‘ChatGPT时刻’还有几年?”当主持人在博鳌亚洲论坛2026年年会抛出这个问题时,台上的几位人形机器人公司负责人

  • 墨西哥相关涉华限制措施被认定构成贸易投资壁垒,商务部回应

      中新经纬3月25日电 商务部网站25日消息,商务部新闻发言人就公布对墨西哥相关涉华限制措施贸易投资壁垒调查最终结论的公告答记者问。  有记者问:商务部公布了对墨西哥相

  • 智能不是炫技,Babycare如何在AI育儿竞争中突围?

      当下,我们正站在一个时代的交汇点上――传统的人口规模红利逐渐减弱,而结构升级所释放的新动能正喷薄而出。  这一变局,在母婴行业尤为深刻。一边是新生儿数量走低,市场整

  • 源杰科技扭亏 拟每10股派7元转增4.5股

      中新经纬3月24日电 3月24日,目前A股全市场第二高价股源杰科技披露年报。  2025年,源杰科技营业收入约6.01亿元,同比增长138.50%;归母净利润约1.91亿元,同比扭亏。公司介绍,

  • 港股三大指数涨超2%,凯乐士科技上市首日涨84.27%

      中新经纬3月24日电 24日,港股三大指数高开,午后震荡上行。截至收盘,恒生指数涨2.79%报25063.71点,恒生科技指数涨2.51%报4830.89点,恒生国企指数涨2.31%报8499.53点。  Win

  • 宝马召回近18万辆汽车,涉及5系、7系、M5

      中新经纬3月24日电 据国家市场监督管理总局网站24日消息,日前,华晨宝马汽车有限公司、宝马(中国)汽车贸易有限公司根据《缺陷汽车产品召回管理条例》和《缺陷汽车产品召回

  • 日榜
  • 周榜
  • 月榜