设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

微软推出iPhone能跑的ChatGPT级模型,网友:OpenAI得把GPT-3.5淘汰了

发布时间: 来源: 量子位

3.8B小模型截胡Llama 3 8BpML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Llama 3发布刚几天,微软就出手截胡了?pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

微软推出iPhone能跑的ChatGPT级模型,网友:OpenAI得把GPT-3.5淘汰了

刚刚发布的Phi-3系列小模型技术报告,引起AI圈热议。pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

微软推出iPhone能跑的ChatGPT级模型,网友:OpenAI得把GPT-3.5淘汰了

其中仅3.8B参数的Phi-3-mini在多项基准测试中超过了Llama 3 8BpML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

为了方便开源社区使用,还特意设计成了与Llama系列兼容的结构。pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

微软推出iPhone能跑的ChatGPT级模型,网友:OpenAI得把GPT-3.5淘汰了

微软这次打出“手机就能直接跑的小模型”的旗号,4bit量化后的phi-3-mini在iPhone 14 pro和iPhone 15使用的苹果A16芯片上跑到每秒12 token。pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

微软推出iPhone能跑的ChatGPT级模型,网友:OpenAI得把GPT-3.5淘汰了

这意味着,现在手机上能本地运行的最佳开源模型,已经做到ChatGPT水平。pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

微软推出iPhone能跑的ChatGPT级模型,网友:OpenAI得把GPT-3.5淘汰了

在技术报告中还玩了一把花活,让phi-3-mini自己解释为什么构建小到手机能跑的模型很令人惊叹。pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

微软推出iPhone能跑的ChatGPT级模型,网友:OpenAI得把GPT-3.5淘汰了

除了mini杯之外,小杯中杯也一并发布:pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Phi-3-small,7B参数,为支持多语言换用了tiktoken分词器,并额外增加10%多语种数据。pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Phi-3-medium,14B参数,在更多数据上训练,多数测试中已超越GPT-3.5和Mixtral 8x7b MoE。pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

(大杯他们目前不打算做)pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

作者阵容一看也不简单,一眼扫过去MSRA和MSR雷蒙德团队都投入了不少人。pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

微软推出iPhone能跑的ChatGPT级模型,网友:OpenAI得把GPT-3.5淘汰了

那么,Phi-3系列到底有什么独特之处呢?pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

根据技术报告中披露,其核心秘诀就在于数据pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

去年团队就发现,单纯堆砌参数量并不是提升模型性能的唯一路径。pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

反而是精心设计训练数据,尤其是利用大语言模型本身去生成合成数据,配合严格过滤的高质量数据,反而能让中小模型的能力大幅跃升。pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

也就是训练阶段只接触教科书级别的高质量数据,Textbooks are all you needpML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

微软推出iPhone能跑的ChatGPT级模型,网友:OpenAI得把GPT-3.5淘汰了

Phi-3也延续了这一思路,这次他们更是下了血本:pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  • 投喂了多达3.3万亿token的训练数据(medium中杯是4.8万亿)
  • 大幅强化了数据的”教育水平”过滤
  • 更多样化的合成数据,涵盖逻辑推理、知识问答等多种技能
  • 独特的指令微调和RLHF训练,大幅提升对话和安全性

举个例子,比如某一天足球比赛的结果可能对于大模型是良好的训练数据,但微软团队删除了这些加强知识的数据,留下更多能提高模型推理能力的数据pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这样一来,对比Llama-2系列,就可以用更小的参数获得更高的MMLU测试分数了。pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

微软推出iPhone能跑的ChatGPT级模型,网友:OpenAI得把GPT-3.5淘汰了

不过小模型毕竟是小模型,也不可避免存在一些弱点。pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

微软透露,模型本身参数中没能力存储太多事实和知识,这一点也可以从TriviaQA测试分数低看出来。pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

缓解办法就是联网接入搜索引擎增强。pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

微软推出iPhone能跑的ChatGPT级模型,网友:OpenAI得把GPT-3.5淘汰了

总之,微软研究院团队是铁了心了要在小模型+数据工程这条路上走下去,未来还打算继续增强小模型的多语言能力、安全性等指标。pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

对于开源小模型超过ChatGPT这回事,不少网友都认为压力现在给到OpenAI这边,需要赶快推出GPT-3.5的继任者了。pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

微软推出iPhone能跑的ChatGPT级模型,网友:OpenAI得把GPT-3.5淘汰了

参考链接:
[1]https://arxiv.org/abs/2404.14219pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

患者只需吸入特制的“氙气”,3.5秒后一幅人体肺部磁共振3D影像就呈现出来。影像中,气体可抵达肺部的位置清晰可见,患者的肺部微结构、气体交换功能情况等一目了然。日前,中国科学院精密测量科学 英国“我超爱科学”网站1月1日刊登题为《什么是“时空连续体”?》的文章,作者是斯蒂芬·伦茨,内容编译如下:“时空连续体”(space-time continuum)是源自于大多数人听说过却未必完全了解的 记者从中国航天科技集团获悉,3月21日13时27分,长征二号丁运载火箭/远征三号上面级在酒泉卫星发射中心起飞,随后将云海二号02组卫星送入预定轨道,发射任务取得圆满成功。云海二号02组卫星由中国航 近日有消息称,huaweiMate60已经停产。作为huawei于2023年8月末发布的最新旗舰机型,huaweiMate60的停产意味着huawei新款旗舰或即将上市,接替Mate60。2023年8月29日,huaweiMate60 Pro、huaweiMate60等 聊到安卓电话的拍照,大部分用户还是比较认可的,而在与iPhone电话的对比中,用户也普遍以为安卓电话的拍照水平要比iPhone更好,当然这一说法也并非空穴来风,其背后的原因直接而明确。首先,硬件配置的竞争 俄罗斯国家航天集团23日发布消息说,俄当天成功发射了“联盟MS-25”载人飞船。消息说,莫斯科时间23日15时36分(北京时间20时36分),“联盟MS-25”载人飞船搭乘“联盟-2.1a”运载火箭从哈萨克斯坦境 。

本文链接:微软推出iPhone能跑的ChatGPT级模型,网友:OpenAI得把GPT-3.5淘汰了http://www.sushuapos.com/show-2-5311-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 对话蚂蚁李建国:当前AI写代码相当于L2.5,实现L3后替代50%人类编程

下一篇: 华为P70闪拍功能意外爆火,CTO亲自下场解读技术原理

热门资讯

推荐资讯

  • 深证成指收涨1.13%,锂电池概念持续走强

      中新经纬3月27日电 27日,A股三大指数低开高走,深证成指领涨。截至收盘,上证指数涨0.63%,报3913.72点;深证成指涨1.13%,报13760.37点;创业板指涨0.71%,报3295.88点。  Wind截图

  • 创业板指半日涨0.83% 创新药概念多股涨停

      中新经纬3月27日电 周五早盘,A股三大指数低开高走。截至午间收盘,上证指数涨0.26%,报3899.12点;深证成指涨0.93%,报13732.34点;创业板指涨0.83%,报3299.57点。  沪深两市半日

  • A股三大指数低开 日韩股市双双走低

      中新经纬3月27日电 周五,A股三大指数集体低开。上证指数跌0.95%,报3852.09点;深证成指跌1.34%,报13423.51点;创业板指跌1.10%,报3236.37点。  来源:同花顺  盘面上,贵金属、

  • 中国人寿总裁利明光回应单季度亏损:建议拉长周期看报表

      中新经纬3月26日电 (李自曼)“周期越短,受到波动影响会更大,这是经营过程中经常遇到的一个现象。”26日,中国人寿总裁利明光在中国人寿2025年度业绩发布会上说。  财报显

  • 瑞银:2027年初黄金目标价5900美元

      中新经纬3月26日电 (罗琨)26日,中新经纬获悉,瑞银财富管理投资总监办公室(CIO)发表机构观点称,黄金仍将发挥对冲作用,预期黄金2027年初目标价将在每盎司5900美元。  本周

  • 2年、5年和10年,人形机器人的“ChatGPT时刻”何时到来?

      中新经纬3月25日电 (薛宇飞 王玉玲)“你们觉得人形机器人的‘ChatGPT时刻’还有几年?”当主持人在博鳌亚洲论坛2026年年会抛出这个问题时,台上的几位人形机器人公司负责人

  • 兴业股份实控人曹连英减持262.08万股,套现超4472万元

      中新经纬3月25日电 兴业股份25日盘后公告,控股股东、实际控制人之一曹连英减持262.08万股股份,套现超4472万元。  具体看,公司于2025年12月18日公告披露,曹连英拟自公告披

  • 涉嫌碰瓷中国石化,“中园石化”被立案调查

      中新经纬3月25日电 位于河北石家庄鹿泉区的“中园石化”加油站,涉嫌碰瓷“中国石化”,被立案调查。  3月25日,据央视新闻报道,鹿泉区相关部门已第一时间赶赴现场开展核查

  • 中国中车等5户央企人事变动

      中新经纬3月24日电 “国资小新”微信号24日发布5户中央企业5名领导人员职务任免消息。  中国中车集团有限公司  王锋任中国中车集团有限公司党委副书记、董事,提名为

  • 多地二手房迎“小阳春”:刚需进场、老破小“真香”

      中新经纬3月24日电 (薛宇飞)“您昨天看的房子,今天卖掉了。”北京工作的郑玫(化名)在看完房子的第二天,房产经纪人就电话告知她,她看中的一套二手房源降价20万元成交了。 

  • A股早盘超4500股飘红 电力板块掀涨停潮

      中新经纬3月24日电 周二早盘,A股三大指数集体高开,此后探底回升。截至午间收盘,上证指数涨0.95%,报3849.34点;深证成指涨0.26%,报13380.05点;创业板指跌0.79%,报3209.76点。  

  • 沪指高开近1%,金属铜、黄金概念等板块上涨

      中新经纬3月24日电 周二,A股三大指数集体高开。上证指数涨0.95%,报3849.63点;深证成指涨1.27%,报13514.67点;创业板指涨0.98%,报3266.93点。  来源:同花顺  盘面上,行业板块

  • 日榜
  • 周榜
  • 月榜