国内首个全国产化千亿参数细粒度MoE语义大模型开源

发布时间: 2025-12-29 09:28:38 来源：中国科学报

观看：165

近日，中电信人工智能科技有限公司和中国电信人工智能研究院（TeleAI）的星辰语义大模型研发团队宣布，国内首个全国产化训练的千亿参数细粒度MoE语义大模型TeleChat3-105B-A4.7-Thinking正式开源。

该模型采用细粒度MoE 架构，基础模型训练数据超 15T，共包括 1 个共享专家和 192 个路由专家（每次激活 4 个专家），模型整体共 105B 参数量，实际激活参数为 4.7B，专家稀疏比处于业界前列。在IFEval、Math-500、AIME2025、Tau2-Bench等十多个权威评测集上，效果对标GPT-OSS-120B、Qwen3-30B-A3B、Qwen3-32B等模型。

面对综合任务场景，TeleChat3-105B-A4.7-Thinking可高效拆解任务需求，整合多项代码能力，一次性交付出完整可运行的代码，实现代码补全、代码修改、网站和网页游戏生成等多类任务，省去大量人工调试时间投入，运行流畅，结果准确。

此外，团队还同步开源了稠密参数模型 TeleChat3-36B-Thinking ，在知识问答、逻辑推理、智能体等维度实现了能力提升，并实现了文本创作、语义理解、角色扮演等任务的针对性优化。

据了解，此前中电信人工智能科技有限公司和中国电信人工智能研究院（TeleAI）已陆续开源自研的TeleChat、TeleChat2 及 TeleChat2.5 系列模型，以传统稠密参数架构为主，模型尺寸覆盖十亿到千亿，构建了全尺寸大模型的开源布局。

面对以大模型通用人工智能为代表的新技术，以及由此带来的工业界、产业界的新发展新模式，MBA人才教育何去何从？ 12月1日，在清近日，“张雪峰称文科都是服务业”这一词条引发网友关注与热议。此前，“考研名师”张雪峰还说过，即使把孩子打晕，也不要四川省科学技术厅关于组织申报2024年第二批中央在川高校院所“聚源兴川”项目的通知各中央在川高校院所、市（州）科关于对拟表扬2023年度甘肃省科技统计先进个人名单进行公示的通知甘科计函〔2024〕15号为树立典型、表扬先进，关于全国科普工作先进集体和先进工作者拟推荐名单的公示根据《科技部中央宣传部中国科协关于评选表彰全国科普河南省科学技术厅关于2024年度河南省国际科技合作项目拟立项项目的公示根据《河南省科技计划项目管理办法（试行）》。

本文链接：国内首个全国产化千亿参数细粒度MoE语义大模型开源http://www.sushuapos.com/show-11-30010-0.html

声明：本网站为非营利性网站，本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇： 2025中国节能协会创新奖揭晓

下一篇：时速700公里国防科大创造超导电动磁悬浮推进世界纪录

国内首个全国产化千亿参数细粒度MoE语义大模型开源

热门资讯

推荐资讯

科学最热文章