网友:Open
GPT-4真的被反超了!
大模型竞技场上,Claude 3大杯Opus新王登基,Elo分数来到榜首。

连小杯Haiku也跻身第二梯队,超过了GPT-4-0613这个型号,把GPT-3.5-turbo远远甩在身后。

Haiku的输入token价格,可是比GPT-3.5-turbo还便宜了一半,输出方面,每100万token也比GPT-3.5-turbo便宜近2块钱。

跟GPT-4相比,价格更是只有1/20。并且Haiku同样支持200k上下文。

难怪有开发者直言:

而在Claude 3加入竞技之前,GPT-4家族已经霸榜快一年了。

给新来的朋友补充一下背景知识:大模型竞技场榜单(LMSYS Chatbot Arena Leaderboard)的评分标准是人类打分,同一个问题同时抛给A、B两个模型,人类裁判觉得哪个回答得好就给哪个投票。
小杯Haiku成开发者新宠
值得一提的是,在竞技场官方贺电中,Haiku这个型号也被专门高亮了出来:

具体有多快,已经有网友做了个直观的对比:
博尔特还没跑完100米,Haiku已经读完100k token的文档了……


事实上,凭借其超高的性价比,在开发者社群中,Claude 3小杯Haiku确已成新宠。
已经有人第一时间大开脑洞,搞出了能让Haiku效果“超频”到大杯Opus水准的开源项目,吸引不少关注。

简单来说,就是让Opus给Haiku当老师:
先用Opus生成执行任务的范例,再用这些教学案例来提高Haiku的姿势水平。
划重点:Haiku的价格仅为Opus的1/60,而响应速度则是Opus的10倍。
这个名为gpt-prompt-engineer的项目目前在GitHub上累计揽下7.3k标星。

还是这位马特老哥,还用Opus和Haiku搞了个“AI股票分析师”,直接火上了GitHub热榜。

不少应用产品也在第一时间接入了Haiku。比如能依据Prompt自动生成网站UI的Vercel。

△就说快不快吧
不过,就在一片给Claude 3新王点赞的声音中,也有网友认为:

但最让开发者们期待的当然还是:

OpenAI,快起来卷(doge)。

— 完 —
英国《自然》周刊网站3月12日刊登题为《OpenAI的文生视频工具Sora会如何改变科学——以及社会》的文章,作者为乔纳森·奥卡拉汉,内容编译如下:美国开放人工智能研究中心(OpenAI 近年来,电动自行车以便利性受到大众青睐,但相关起火事故威胁着居民的生命财产安全。据国家消防救援局发布的统计数据,2023年全国共接报电动自行车火灾2.1万起,比2022年增加17.4%。电动自行车起火 21世纪经济报道记者王峰北京报道 近日,全球教育集团培生(NYSE:PSO)公布2023财年财报。2023财年,培生的销售额为36.74亿英镑(下同),同比下降4%,但基础销售额同比增长1%;调整后营业利润5.73亿,同 那些在吃完一顿饱饭后不久就在冰箱里翻找零食的人,可能不是胃口好,而是因为寻找食物的神经元过度活跃的缘故。美国加州大学洛杉矶分校心理学家在老鼠大脑中发现了一个回路:即使它们不饿,也会让它 美国加州理工学院喷气推进实验室的一个机器人专家团队,与卡内基梅隆大学机器人研究所科学家合作,开发出一种蛇形机器人,用于调查土星第六大卫星土卫二的地形,以寻找生命的“蛛丝马迹”。相关研究 有消息称,iPhone在中国寻找本土生成式AI提供方,iPhone讨论了在中国的设备中使用百度的人工智能技术。据《华尔街日报》报道,iPhone与百度进行了谈判,以授权其型号。这可能是为了向中国的iPhone客户提 。本文链接:Claude 3反超GPT-4竞技场登顶!小杯Haiku成开发者新宠:性价比无敌http://www.sushuapos.com/show-2-4324-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
上一篇: 亚马逊新研究:掌握AI技能的员工薪资增幅有望超过30%
下一篇: 黄仁勋的英伟达帝国并非牢不可破