设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

0门槛免费商用!孟子3-13B大模型正式开源,万亿token数据训练

发布时间: 来源: 量子位

基于Llama架构Zdf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

澜舟科技官宣:孟子3-13B大模型正式开源!Zdf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这一主打高性价比的轻量化大模型,面向学术研究完全开放,并支持免费商用。Zdf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

0门槛免费商用!孟子3-13B大模型正式开源,万亿token数据训练

在MMLU、GSM8K、HUMAN-EVAL等各项基准测评估中,孟子3-13B都表现出了不错的性能。Zdf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

尤其在参数量20B以内的轻量化大模型领域,在中英文语言能力方面尤为突出,数学和编程能力也位于前列。Zdf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

0门槛免费商用!孟子3-13B大模型正式开源,万亿token数据训练

据介绍,孟子3-13B大模型是基于Llama架构,数据集规模高达3T TokensZdf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

语料精选自网页、百科、社交、媒体、新闻,以及高质量的开源数据集。通过在万亿tokens上进行多语言语料的继续训练,模型的中文能力突出并且兼顾多语言能力。Zdf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

孟子3-13B大模型开源

只需两步,就能使用孟子3-13B大模型了。Zdf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

首先进行环境配置。Zdf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

pip install -r requirements.txtZdf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

然后快速开始。Zdf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer
tokenizer =Zdf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
AutoTokenizer.from_pretrained(“Langboat/Mengzi3-13B-Base”, use_fast=False, trust_remote_code=True)
model =Zdf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
AutoModelForCausalLM.from_pretrained(“Langboat/Mengzi3-13B-Base”, device_map=”auto”, trust_remote_code=True)
inputs = tokenizer(‘指令:回答以下问题。输入:介绍一下孟子。输出:’, return_tensors=’pt’)
if torch.cuda.is_available():
inputs = inputs.to(‘cuda’)
pred = model.generate(**inputs, max_new_tokens=512, repetition_penalty=1.01, eos_token_id=tokenizer.eos_token_id)
print(tokenizer.decode(pred[0], skip_special_tokens=True))Zdf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

此外,他们还提供了一个样例代码,可用于基础模型进行单轮交互推理。Zdf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

cd examples
python examples/base_streaming_gen.py –model model_path –tokenizer tokenizer_pathZdf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

如果想要进行模型微调,他们也提供了相关文件和代码。Zdf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

0门槛免费商用!孟子3-13B大模型正式开源,万亿token数据训练

事实上,早在3月18日的澜舟大模型技术和产品发布会现场,就透露了孟子3-13B大模型的诸多细节。Zdf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

当时他们表示,孟子3-13B大模型训练已经完成。Zdf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

对于选择13B版本的原因,周明解释道:Zdf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

首先,澜舟明确以服务ToB场景为主,ToC为辅。Zdf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

实践发现,ToB场景使用频率最高的大模型参数量多为7B、13B、40B、100B,整体集中在10B-100B之间。Zdf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

其次,在这个区间范围内,从ROI(投资回报率)角度来讲,既满足场景需求,又最具性价比。Zdf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

因此,在很长一段时间内,澜舟的目标都是在10B-100B参数规模范围内,打造优质的行业大模型。Zdf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

作为国内最早一批大模型创业团队,去年3月,澜舟就发布了孟子GPT V1(MChat)。Zdf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

今年1月,孟子大模型GPT V2(含孟子大模型-标准、孟子大模型-轻量、孟子大模型-金融、孟子大模型-编码)对公众开放。Zdf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

0门槛免费商用!孟子3-13B大模型正式开源,万亿token数据训练

好了,感兴趣的朋友可戳下方链接体验一下。Zdf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

GitHub链接:Zdf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
https://github.com/Langboat/Mengzi3Zdf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
HuggingFace:Zdf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
https://huggingface.co/Langboat/Mengzi3-13B-BaseZdf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
ModelScope:Zdf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
https://www.modelscope.cn/models/langboat/Mengzi3-13B-BaseZdf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
Wisemodel:Zdf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
https://wisemodel.cn/models/Langboat/Mengzi3-13B-BaseZdf速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

随着历史的车轮驶入2024年,大模型、AIGC等话题引发广泛热议,云计算与AI技术展现出了前所未有的深度融合趋势,就如同寒武纪的生物大爆发,激发着各行各业的创新浪潮。新质生产力时代到来,政企用云进 竹类植物是竹亚科植物的总称,与水稻、小麦、大麦和燕麦同属于禾本科BOP分支,具有重要的经济、生态和文化价值。为更好地服务竹类植物的系统进化和功能研究,有效整理归纳盘活海量的竹类组学和分 3月18日,在2024年黑龙江农机产品展示交易会上,一部可智能播种,又可助力增产的电驱气吸播种机引发众人关注。这台高端智能电驱气吸播种机的价格与机械播种机价格相当,据悉,研发团队通过自主研发和 记者从中国科学院金属研究所获悉,该所沈阳材料科学国家研究中心胡卫进研究员与合作者,提出利用缓冲层定量调控薄膜应变,延迟铁电薄膜晶格弛豫从而增强铁电极化强度的策略,成功揭示极化强度同铁电 3月19日,记者从香港科技大学获悉,该校以人工智能生成式工具设计出10位“AI讲师”, 这些“AI讲师”来自世界各地,属不同民族及文化背景。该校希望通过创新教学模式,激发学生学习热情,提升课堂参与度 有消息称,iPhone在中国寻找本土生成式AI提供方,iPhone讨论了在中国的设备中使用百度的人工智能技术。据《华尔街日报》报道,iPhone与百度进行了谈判,以授权其型号。这可能是为了向中国的iPhone客户提 。

本文链接:0门槛免费商用!孟子3-13B大模型正式开源,万亿token数据训练http://www.sushuapos.com/show-2-4453-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 百度携手优必选,共探AI大模型+人形机器人创新应用

下一篇: 机器狗首次阵亡!美国警方披露详情

热门资讯

推荐资讯

  • 创业板指半日涨0.83% 创新药概念多股涨停

      中新经纬3月27日电 周五早盘,A股三大指数低开高走。截至午间收盘,上证指数涨0.26%,报3899.12点;深证成指涨0.93%,报13732.34点;创业板指涨0.83%,报3299.57点。  沪深两市半日

  • 燃油成本持续上涨,美国邮政局扛不住了

      中新经纬3月26日电 据路透社报道,美国邮政局周三宣布,正申请获批对优先邮件及包裹递送服务临时涨价8%,该调整拟于4月26日生效,用以应对持续攀升的交通燃油成本。  报道称,

  • 沪指半日跌0.58% 光伏设备板块集体回调

      中新经纬3月26日电 周四早盘,A股三大指数早盘冲高回落。截至午间收盘,上证指数跌0.58%,报3909.16点;深证成指跌0.38%,报13748.30点;创业板指跌0.07%,报3314.64点。  沪深两市

  • 对话职业人|交5万“学费”,我从编剧变成“一人剧组”

      中新经纬3月26日电 (罗琨)凌晨两三点,莫争还在电脑前盯着屏幕,反复调整镜头。画面里,一个男人正试图钻进一辆冷藏车的车底。他注意到一个破绽:这个男人钻进去时还穿着长袖,出

  • 东阿阿胶副总裁李庆川辞职

      中新经纬3月26日电 东阿阿胶股份有限公司(下称“东阿阿胶”)近日发布公告称,董事会收到李庆川提交的书面辞职报告,由于工作变动原因,李庆川申请辞去公司副总裁职务。辞职后

  • 美股三大指数收涨!ARM涨超16%,国际油价跌超2%

      中新经纬3月26日电 国际油价回落,美国股市出现回暖。当地时间25日,美股三大指数集体收涨,道指涨0.66%,纳指涨0.77%,标普500指数涨0.54%。  美国大型科技股多数上涨,亚马逊涨

  • 2年、5年和10年,人形机器人的“ChatGPT时刻”何时到来?

      中新经纬3月25日电 (薛宇飞 王玉玲)“你们觉得人形机器人的‘ChatGPT时刻’还有几年?”当主持人在博鳌亚洲论坛2026年年会抛出这个问题时,台上的几位人形机器人公司负责人

  • “中园石化”被立案调查 律师解读是否涉嫌“傍名牌”|宅男财经

      【宅男财经|专家面对面】有网友发帖称,加完油才发现自己去的是“中园石化”,而不是“中国石化”,并称名字真的太像了!当前,河北石家庄鹿泉区市监局已对此立案调查,将根据调

  • 洲际油气高息借钱,还压上核心资产

      中新经纬3月25日电 (张澍楠)贷款利率10.5%、核心资产担保、被抵押主体资产高于合并报表总资产,这些字眼出现在洲际油气下属子公司贷款公告中。  上交所网站截图  该

  • 瞄准全能出行助理,飞猪发布首个全品类旅行skill,支持便捷交易

      3月24日,飞猪发布首个全品类出行旅游技能插件(skill)“flyai”,该技能插件已上线ClawHub、GitHub等平台。开发者和用户可以在OpenClaw、悟空、Kimi Claw、QoderWork、QCla

  • A股三大指数集体高开 贵金属板块领涨

      中新经纬3月25日电 周三,A股三大指数集体高开。上证指数涨0.28%,报3892.27点;深证成指涨0.98%,报13669.05点;创业板指涨1.10%,报3287.17点。  盘面上,行业板块中,贵金属、小金

  • 佰维存储斥资百亿签存储采购合同

      中新经纬3月25日电 深圳佰维存储科技股份有限公司(简称“佰维存储”)25日盘后公告,佰维存储与某存储原厂签订15亿美元的某款存储晶圆重大采购合同。来源:公告截图  具体

  • 日榜
  • 周榜
  • 月榜