设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

马斯克用行动反击 开源自家顶级大模型 压力给到OpenAI

2024-03-20 17:23:16 来源:

  马斯克用行动反击 开源自家顶级大模型 压力给到OpenAIzmT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  《科创板日报》3月18日讯(编辑 宋子乔) 似乎是为了表明自己始终坚持对AI模型开源,马斯克做出了与阿尔特曼全然不同的选择。3月17日,马斯克宣布开源Grok-1,这使得Grok-1成为当前参数量最大的开源大语言模型,拥有3140亿参数,远超OpenAI GPT-3.5的1750亿。zmT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  有意思的是,Grok-1宣布开源的封面图为Midjourney生成,可谓“AI helps AI”。zmT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  一直吐槽OpenAI不open的马斯克,自然要在社交平台上含沙射影一番,“我们想了解更多OpenAI的开放部分。”zmT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  Grok-1遵照Apache 2.0协议开放模型权重和架构。这意味着它允许用户自由地使用、修改和分发软件,无论是个人还是商业用途。这种开放性鼓励了更广泛的研究和应用开发。项目发布至今,已经在GitHub上揽获6.5k星标,热度还在持续增加。zmT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  项目说明中明确强调,由于Grok-1是一个规模较大(314B参数)的模型,需要有足够GPU内存的机器才能使用示例代码测试模型。网友表示这可能需要一台拥有628 GB GPU内存的机器。zmT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  此外,该存储库中MoE层的实现效率并不高,之所以选择该实现是为了避免需要自定义内核来验证模型的正确性。zmT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  目前已开源的热门大模型包括Meta的Llama2、法国的Mistral等。通常来说,发布开源模型有助于社区展开大规模的测试和反馈,意味着模型本身的迭代速度也能加快。zmT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  Grok-1是一个混合专家(Mixture-of-Experts,MOE)大模型,由马斯克旗下的AI创企xAI在过去4个月里开发。回顾该模型的开发历程:zmT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  在宣布成立xAI之后,相关研究人员首先训练了一个330亿参数的原型语言模型(Grok-0),这个模型在标准语言模型测试基准上接近LLaMA2(70B)的能力,但使用了更少的训练资源;zmT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  之后,研究人员对模型的推理和编码能力进行了重大改进,最终开发出了Grok-1并于2023年11月发布,这是一款功能更为强大的SOTA语言模型,在HumanEval编码任务中达到了63.2%的成绩,在MMLU中达到了73%,超过了其计算类中的所有其他模型,包括ChatGPT-3.5和Inflection-1。zmT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  与其他大模型相比,Grok-1的优势在哪呢?zmT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  xAI特别强调,Grok-1是他们自己从头训练的大模型,即从2023年10月开始使用自定义训练堆栈在JAX和Rust上训练,没有针对特定任务(如对话)进行微调;zmT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  Grok-1的一个独特而基本的优势是,它可以通过X平台实时了解世界,这使得它能够回答被大多数其他AI系统拒绝的辛辣问题。Grok-1发布版本所使用的训练数据来自截至2023年第三季度的互联网数据和xAI的AI训练师提供的数据;zmT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  3140亿参数的Mixture-of-Experts模型,其对于每个token,活跃权重比例为25%,这一庞大的参数量为其提供了强大的语言理解和生成能力。zmT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  xAI此前介绍,Grok-1将作为Grok背后的引擎,用于自然语言处理任务,包括问答、信息检索、创意写作和编码辅助。未来,长上下文的理解与检索、多模态能力都是该模型将会探索的方向之一。zmT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本文链接:马斯克用行动反击 开源自家顶级大模型 压力给到OpenAIhttp://www.sushuapos.com/show-2-3998-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 马斯克开源3140亿参数的Grok,大模型争相开源所为何求?

下一篇: AI领域,重磅消息传来!

热门资讯

推荐资讯

  • 三部门:进一步支持各类境外机构投资者开展债券回购业务

      中新经纬9月26日电 据“中国人民银行”微信公众号消息,2025年9月26日,中国人民银行、中国证监会、国家外汇局联合发布公告,支持可在中国债券市场开展债券现券交易的境外机

  • Pi币盯上银发族 “零成本挖矿”或藏陷阱

      Pi币盯上银发族 “零成本挖矿”或藏陷阱  经济观察报 记者 老盈盈  9月22日上午,李先生从浙江出发,来到北方一座城市的指定地点,在一位自称“办理圆周率企业质押兑换”

  • *ST星农被证监会立案

      中新经纬9月29日电 *ST星农29日盘后公告,公司近日收到中国证监会下发的《立案告知书》,因公司涉嫌信息披露违法违规,根据《中华人民共和国证券法》《中华人民共和国行政处

  • 8月金融业信用指数首次突破170点

      中新经纬9月29日电 据国家市场监督管理总局网站消息,8月中国企业信用水平保持稳中有进发展态势。  今年8月,中国企业信用指数为162.60,我国企业信用水平保持总体平稳、

  • 深成指收涨2.05%,锂电板块飙涨

      中新经纬9月29日电 A股三大指数开盘短暂震荡,随后走强,午后出现明显拉升。截至收盘,沪指涨0.9%,报3862.53点;深成指涨2.05%,报13479.43点;创业板指涨2.74%,报3238.01点。两市合

  • 专家预测2025国庆出游趋势:缓解压力>走马观花式打卡|宅男财经

      【宅男财经|专家面对面】国庆端午假期将至,今年的假期出游有何趋势?北京体育大学体育休闲与旅游学院副教授陈希称,此次超长黄金周带来的最明显的变化就是游客能够前往距

  • 三部门开展规范法律咨询服务机构专项行动

      中新经纬9月29日电 据司法部官方微信29日消息,为切实强化法律咨询服务机构监管,在前期深入开展专题调研基础上,司法部、公安部、市场监管总局决定自2025年9月至12月,在全国

  • 创业板指午盘涨1.77% 新能源板块强势

      中新经纬9月29日电 29日早间,A股三大指数震荡回升,创业板指盘中一度涨近3%。  截至午间收盘,上证指数涨0.13%,报3832.90点;深证成指涨1.11%,报13355.98点;创业板指涨1.77%,报3

  • 沪指平开 锂电池产业链活跃

      中新经纬9月29日电 29日早间,上证指数平开,报3828.17点;深证成指涨0.30%,报13248.20点;创业板指涨0.43%,报3165.07点。  来源:Wind  盘面上,锂电池产业链活跃,天际股份涨逾9%

  • 中粮科工原董事长姚专被开除党籍

      中新经纬9月28日电 中央纪委国家监委网站28日消息,据中央纪委国家监委驻中粮集团纪检监察组、江苏省纪委监委消息:日前,中央纪委国家监委驻中粮集团纪检监察组、江苏省无锡

  • 官方预测:中秋国庆假期全社会跨区域人员流动量将达23.6亿人次

      中新经纬9月28日电 国新办28日就中秋国庆假期交通运输服务保障有关情况举行新闻发布会。交通运输部副部长李扬在会上介绍,根据分析和预测,中秋、国庆假期全社会跨区域人员

  • 恒生科技指数收跌2.89%,地平线机器人跌超8%

      中新经纬9月26日电 26日,港股三大指数低开低走。截至收盘,恒指跌1.35%报26128.20点,恒生科技指数跌2.89%报6195.11点,恒生国企指数跌1.49%报9303.10点。  Wind截图  盘

  • 日榜
  • 周榜
  • 月榜