“北京造”大模型GLM-4.5开源综合性能世界领先

发布时间: 2025-08-01 10:56:35 来源：千龙网

观看：149

7月28日晚，北京智谱华章科技股份有限公司（以下简称"智谱AI"）发布其新一代旗舰大模型GLM-4.5，这是一款专为智能体应用打造的基础模型，在复杂推理、代码生成及智能体交互等通用能力上实现能力融合与技术突破，综合测试性能已跻身全球领先行列。

这款新模型的发布，代表了AI迈向通用人工智能的一次重要转变。它不再满足于扮演一个被动回答问题的“聊天机器人”，而是要成为能够理解复杂目标、自主规划并执行多步骤任务的“全优生”。例如，模型能够胜任全栈开发任务，一键生成较为复杂的应用、游戏、交互网页。在实际例子中，用户通过z.ai使用该模型时，仅用一句简单的指令，就可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可以发弹幕的“B站”，甚至直接上线一个完整的“Flappy Bird”小游戏。

在性能评估中，GLM-4.5的表现展示了其架构优势。在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中，其综合得分位列全球第三，在所有国产模型和开源模型中均排名第一。

大型语言模型性能评估表，包含智能体、推理与编码基准测试数据（图源：智谱）

该款旗舰大模型发布仅十小时，便引发全球外媒关注。价格因素同样是关注焦点，报道普遍聚焦该模型 “成本更低、性能更优” 的特性，部分媒体还对其参数进行了详细解析与同类对比。目前该系列模型API调用价格低至输入0.8元/百万tokens、输出2元/百万tokens，远低于市场主流价格。

28日模型发布后不到两个小时，X平台就在首页推荐了这款中国大模型。CNBC在28日报道称：“中国企业正在研发的人工智能模型不仅智能化水平提升，使用成本也持续降低，这与深度求索（DeepSeek）当年震动市场的突破核心优势相呼应。” 路透社28日在报道中提到，作为中国 “AI 六小虎” 之一的智谱，自今年6月被OpenAI“点名”后便备受关注。彭博社表示，OpenAI的挑战者智谱AI发布开源模型，试图在这个蓬勃发展的行业中抢占制高点。另一家美国知名科技媒体VentureBeat则在文章中指出：“GLM-4.5的发布为企业团队提供了一个可行的、高性能的基础模型。对于平衡创新和运营限制的团队来说，这是一个令人信服的选择。”发布后不到12小时，GLM-4.5模型已经位列国际开源社区Hugging-Face榜单全球第二。《环球时报》针对于该款模型进行整版报道，受到国内外业界高度关注。

美国科技网站Techi 认为，中国AI发展正清晰呈现 “易获取” 的趋势：“智谱努力与深度求索、OpenAI等行业巨头同台竞技。随着更多企业推出开源模型并压低价格，中国正逐步成为全球AI竞争的核心参与者，力争占据领先地位。未来几个月，这些快速变化将带来何种影响——是催生新的监管政策，还是推动新的技术创新，仍有待观察。”

受到大模型关注的除了这款大模型的性能，还有一个最大亮点是这是首款原生融合模型，首次在单个模型中实现将推理、编码和智能体能力原生融合，以满足智能体应用的复杂需求。

大语言模型的目标是在广泛领域达到人类认知水平。然而，现有模型仍然算不上真正的通用模型：有些擅长编程，有些精于数学，有些在推理方面表现出色，但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力，力求在一个模型中集成所有这些不同的能力。大模型的下一个范式，一定是把各种能力整合到一起，成为一个“全优生”。

其次这款模型拥有更高的参数效率。GLM-4.5的参数量仅为一些主流模型的一半甚至三分之一，但在多项标准基准测试中表现得更为出色。在衡量模型代码能力的SWE-bench Verified 榜单上，GLM-4.5系列位于性能/参数比帕累托前沿，这表明在相同规模下，GLM-4.5系列实现了最佳性能。

目前，这款集高性能、低成本和开源特性于一体的模型已在智谱开放平台上线。用户可通过智谱大模型开放平台使用该模型，其开源版本也将同步登陆Hugging Face与ModelScope平台。

7月28日晚，北京智谱华章科技股份有限公司（以下简称"智谱AI"）发布其新一代旗舰大模型GLM-4.5，这是一款专为智能体应用打造的基础模型，在复杂推理、代码生成及智能体交互等通用能力上实现能力融合与技术突破，综合测试性能已跻身全球领先行列。

这款新模型的发布，代表了AI迈向通用人工智能的一次重要转变。它不再满足于扮演一个被动回答问题的“聊天机器人”，而是要成为能够理解复杂目标、自主规划并执行多步骤任务的“全优生”。例如，模型能够胜任全栈开发任务，一键生成较为复杂的应用、游戏、交互网页。在实际例子中，用户通过z.ai使用该模型时，仅用一句简单的指令，就可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可以发弹幕的“B站”，甚至直接上线一个完整的“Flappy Bird”小游戏。

在性能评估中，GLM-4.5的表现展示了其架构优势。在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中，其综合得分位列全球第三，在所有国产模型和开源模型中均排名第一。

大型语言模型性能评估表，包含智能体、推理与编码基准测试数据（图源：智谱）

该款旗舰大模型发布仅十小时，便引发全球外媒关注。价格因素同样是关注焦点，报道普遍聚焦该模型 “成本更低、性能更优” 的特性，部分媒体还对其参数进行了详细解析与同类对比。目前该系列模型API调用价格低至输入0.8元/百万tokens、输出2元/百万tokens，远低于市场主流价格。

28日模型发布后不到两个小时，X平台就在首页推荐了这款中国大模型。CNBC在28日报道称：“中国企业正在研发的人工智能模型不仅智能化水平提升，使用成本也持续降低，这与深度求索（DeepSeek）当年震动市场的突破核心优势相呼应。” 路透社28日在报道中提到，作为中国 “AI 六小虎” 之一的智谱，自今年6月被OpenAI“点名”后便备受关注。彭博社表示，OpenAI的挑战者智谱AI发布开源模型，试图在这个蓬勃发展的行业中抢占制高点。另一家美国知名科技媒体VentureBeat则在文章中指出：“GLM-4.5的发布为企业团队提供了一个可行的、高性能的基础模型。对于平衡创新和运营限制的团队来说，这是一个令人信服的选择。”发布后不到12小时，GLM-4.5模型已经位列国际开源社区Hugging-Face榜单全球第二。《环球时报》针对于该款模型进行整版报道，受到国内外业界高度关注。

美国科技网站Techi 认为，中国AI发展正清晰呈现 “易获取” 的趋势：“智谱努力与深度求索、OpenAI等行业巨头同台竞技。随着更多企业推出开源模型并压低价格，中国正逐步成为全球AI竞争的核心参与者，力争占据领先地位。未来几个月，这些快速变化将带来何种影响——是催生新的监管政策，还是推动新的技术创新，仍有待观察。”

受到大模型关注的除了这款大模型的性能，还有一个最大亮点是这是首款原生融合模型，首次在单个模型中实现将推理、编码和智能体能力原生融合，以满足智能体应用的复杂需求。

大语言模型的目标是在广泛领域达到人类认知水平。然而，现有模型仍然算不上真正的通用模型：有些擅长编程，有些精于数学，有些在推理方面表现出色，但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力，力求在一个模型中集成所有这些不同的能力。大模型的下一个范式，一定是把各种能力整合到一起，成为一个“全优生”。

其次这款模型拥有更高的参数效率。GLM-4.5的参数量仅为一些主流模型的一半甚至三分之一，但在多项标准基准测试中表现得更为出色。在衡量模型代码能力的SWE-bench Verified 榜单上，GLM-4.5系列位于性能/参数比帕累托前沿，这表明在相同规模下，GLM-4.5系列实现了最佳性能。

目前，这款集高性能、低成本和开源特性于一体的模型已在智谱开放平台上线。用户可通过智谱大模型开放平台使用该模型，其开源版本也将同步登陆Hugging Face与ModelScope平台。

3月18日，中国经济信息社（以下简称中经社）垂直领域数字化应用系统发布仪式在北京举行。在发布仪式上，锚定建设“国家级经济信息旗舰”的目标，中经社推出了八大数字化应用系统。中经社此次发布的行据阿根廷布宜诺斯艾利斯经济新闻网2月19日报道，在人工智能(AI)迅速重新定义就业格局的今天，通常被称为“软”技能的人类技能成为最有韧性、最有价值的技能。这是阿尼什·拉曼和玛丽亚&mi 记者3月20日来到广东深汕西高速公路改扩建施工现场，看到智能机器人、自动化生产线等智能制造设备在不停运行。3月19日—20日，由茅以升科技教育基金会和广东省交通集团联合主办的全国高速记者3月19日从天津大学获悉，该校环境学院刘庆岭教授团队与吉林大学于吉红院士团队以及天津工业大学梅东海教授团队合作，证明了无有机模板剂合成的具有OFF和ERI拓扑共生结构的Cu-T催化剂具有优联合国机构3月20日发布的《全球电子垃圾监测》报告显示，2022年全球范围内共产生6200万吨电子垃圾，其中仅有不到四分之一被回收利用。报告显示，2022年全球电子垃圾的产生量相比2010年增长了82%。作为功能机时代的霸主，诺基亚手机曾经创造了巨大的辉煌，但也因错失智能手机发展机遇而“掉队”。近期，外媒Visual Capitalist统计了有史以来最畅销的15款手机型号，其中诺基亚和苹果包揽前十。今。

本文链接：“北京造”大模型GLM-4.5开源综合性能世界领先http://www.sushuapos.com/show-2-13317-0.html

声明：本网站为非营利性网站，本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：调查｜外骨骼机器人火了！能干啥？哪儿能买？贵不贵？

下一篇：清华突破软体机器人操控难题磁性机器人像“液滴”般移动

“北京造”大模型GLM-4.5开源综合性能世界领先

热门资讯

推荐资讯

科技最热文章

“北京造”大模型GLM-4.5开源 综合性能世界领先

热门资讯

推荐资讯

科技最热文章

“北京造”大模型GLM-4.5开源综合性能世界领先