3.8B小模型截胡Llama 3 8BpML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
Llama 3发布刚几天,微软就出手截胡了?pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

刚刚发布的Phi-3系列小模型技术报告,引起AI圈热议。pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

其中仅3.8B参数的Phi-3-mini在多项基准测试中超过了Llama 3 8B。pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
为了方便开源社区使用,还特意设计成了与Llama系列兼容的结构。pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

微软这次打出“手机就能直接跑的小模型”的旗号,4bit量化后的phi-3-mini在iPhone 14 pro和iPhone 15使用的苹果A16芯片上跑到每秒12 token。pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这意味着,现在手机上能本地运行的最佳开源模型,已经做到ChatGPT水平。pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在技术报告中还玩了一把花活,让phi-3-mini自己解释为什么构建小到手机能跑的模型很令人惊叹。pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

除了mini杯之外,小杯中杯也一并发布:pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
Phi-3-small,7B参数,为支持多语言换用了tiktoken分词器,并额外增加10%多语种数据。pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
Phi-3-medium,14B参数,在更多数据上训练,多数测试中已超越GPT-3.5和Mixtral 8x7b MoE。pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
(大杯他们目前不打算做)pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
作者阵容一看也不简单,一眼扫过去MSRA和MSR雷蒙德团队都投入了不少人。pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

那么,Phi-3系列到底有什么独特之处呢?pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
根据技术报告中披露,其核心秘诀就在于数据。pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
去年团队就发现,单纯堆砌参数量并不是提升模型性能的唯一路径。pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
反而是精心设计训练数据,尤其是利用大语言模型本身去生成合成数据,配合严格过滤的高质量数据,反而能让中小模型的能力大幅跃升。pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
也就是训练阶段只接触教科书级别的高质量数据,Textbooks are all you need。pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Phi-3也延续了这一思路,这次他们更是下了血本:pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
- 投喂了多达3.3万亿token的训练数据(medium中杯是4.8万亿)
- 大幅强化了数据的”教育水平”过滤
- 更多样化的合成数据,涵盖逻辑推理、知识问答等多种技能
- 独特的指令微调和RLHF训练,大幅提升对话和安全性
举个例子,比如某一天足球比赛的结果可能对于大模型是良好的训练数据,但微软团队删除了这些加强知识的数据,留下更多能提高模型推理能力的数据。pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
这样一来,对比Llama-2系列,就可以用更小的参数获得更高的MMLU测试分数了。pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不过小模型毕竟是小模型,也不可避免存在一些弱点。pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
微软透露,模型本身参数中没能力存储太多事实和知识,这一点也可以从TriviaQA测试分数低看出来。pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
缓解办法就是联网接入搜索引擎增强。pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

总之,微软研究院团队是铁了心了要在小模型+数据工程这条路上走下去,未来还打算继续增强小模型的多语言能力、安全性等指标。pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
对于开源小模型超过ChatGPT这回事,不少网友都认为压力现在给到OpenAI这边,需要赶快推出GPT-3.5的继任者了。pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

参考链接:
[1]https://arxiv.org/abs/2404.14219pML速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
患者只需吸入特制的“氙气”,3.5秒后一幅人体肺部磁共振3D影像就呈现出来。影像中,气体可抵达肺部的位置清晰可见,患者的肺部微结构、气体交换功能情况等一目了然。日前,中国科学院精密测量科学
英国“我超爱科学”网站1月1日刊登题为《什么是“时空连续体”?》的文章,作者是斯蒂芬·伦茨,内容编译如下:“时空连续体”(space-time continuum)是源自于大多数人听说过却未必完全了解的
记者从中国航天科技集团获悉,3月21日13时27分,长征二号丁运载火箭/远征三号上面级在酒泉卫星发射中心起飞,随后将云海二号02组卫星送入预定轨道,发射任务取得圆满成功。云海二号02组卫星由中国航
近日有消息称,huaweiMate60已经停产。作为huawei于2023年8月末发布的最新旗舰机型,huaweiMate60的停产意味着huawei新款旗舰或即将上市,接替Mate60。2023年8月29日,huaweiMate60 Pro、huaweiMate60等
聊到安卓电话的拍照,大部分用户还是比较认可的,而在与iPhone电话的对比中,用户也普遍以为安卓电话的拍照水平要比iPhone更好,当然这一说法也并非空穴来风,其背后的原因直接而明确。首先,硬件配置的竞争
俄罗斯国家航天集团23日发布消息说,俄当天成功发射了“联盟MS-25”载人飞船。消息说,莫斯科时间23日15时36分(北京时间20时36分),“联盟MS-25”载人飞船搭乘“联盟-2.1a”运载火箭从哈萨克斯坦境
。
本文链接:微软推出iPhone能跑的ChatGPT级模型,网友:OpenAI得把GPT-3.5淘汰了http://www.sushuapos.com/show-2-5311-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
上一篇: 对话蚂蚁李建国:当前AI写代码相当于L2.5,实现L3后替代50%人类编程
下一篇: 华为P70闪拍功能意外爆火,CTO亲自下场解读技术原理