设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

OpenAI o1大模型“猎杀时刻”:当AI开始“类思考”,低维争夺结束了

发布时间: 2024-09-14 09:04:39 来源:

21世纪经济报道记者孔海丽 北京报道XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

预热一年之久,OpenAI代号为“草莓”的项目终于发布。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

北京时间9月13日凌晨,OpenAI甩出了重大更新,传说中推理能力登峰造极的大语言模型——OpenAI o1系列模型亮相,复杂推理能力明显更进一步,极限推理能力甚至超越人类博士水平,代表了大语言模型在推理能力上的重大飞跃。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

最惊人的是,OpenAI o1系列已经开始展现出“类思考”的能力——之所以说“类思考”,是因为目前为止,AI大模型尚未突破思考的本质。“自我推理”路径,更像是达到AGI之前的“花活儿”。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

但,当下还未突破,并不意味着未来不可能。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

从“什么都懂一点的‘人工智障’”,到“会自我纠正、选择合适路径”的人工智能,通向AGI的路径,在逐渐清晰。尤其,OpenAI当前放出的o1-preview和o1-mini,还只是o1系列的“前菜”,按照OpenAI的调性,更多突破或许已经发生,只待合适的时机一一发布。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

正如李彦宏戳破大模型“跑分”假象,OpenAI 凭借o1系列,又一次把大模型的竞争拉高到了新的水准,低维度的参数、榜单之争,似乎不再有实际意义。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

大模型开始“逐步思考”

根据OpenAI官方消息,o1系列包括o1-preview和o1-mini,前者是“预览版本”,后者是经济高效的“小模型”,比preview便宜80%。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这些模型专门为处理更复杂的、多步骤的问题而开发,尤其是在科学、数学和编程领域,超越了之前的模型(如GPT-4)在推理深度和准确性方面的表现。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Sam Altman在X上贴出的对比图显示,o1解决数学、编程和博士级别科学题目上的能力,比GPT-4o高出数倍。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI甚至明确指出,“o1不是gpt-4o的继任者”,潜台词在于,o1开启了一段新的纪元。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

整体来看,o1在美国数学奥林匹克预选赛中,排名美国前500名学生之列,并且在物理、生物学、化学基准上,首次超过了人类博士。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

但在另一项创新之下,这些得分竟显得“平平无奇”了起来。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI o1引入了“思路链”。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

类似于人类在回答困难问题之前可能会思考很长时间,o1 在尝试解决问题时学会了磨练其思维链并改进策略。它学会了识别和纠正错误,学会了将棘手的步骤分解为更简单的步骤,学会了在当前方法不起作用时继续尝试不同的方法。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这种方法模拟了人类的认知过程,能够逐步完善每个步骤,甚至在一个问题中实现自我迭代,而结果就是,显著提高了模型的推理能力。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

以一道阅读理解题为例,GPT-4o会直接给出结论,而OpenAI o1-preview有“显示思路链”选项,打开之后,o1-preview会将整个思考过程展示出来,逐步分析每个选项,并反复自问“这是一个很好的解释吗?能回答问题本身吗?”并在一遍又一遍地推敲之后,给出正确答案。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

当然,想要节省时间的用户也可以选择“隐藏思路链”。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

英伟达高级科学家Jim Fan对OpenAI o1高度赞扬,他认为,AlphaGo式的自我学习终于有可能在大模型中实现了。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“Strawberry很容易变成一个数据的飞轮。如果答案是正确的,整个搜索跟踪就成为一个小型的训练样本数据集,其中包含正面和负面的反馈。这反过来会改进未来版本GPT的推理核心,就像AlphaGo的价值网络——用来评估每个棋盘位置的质量——随着MCTS生成越来越精细的训练数据而改进一样。”XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

也就是说,未来大模型自我学习与思考的能力会像一个飞轮一样转起来,就像AlphaGo自己与自己对弈以提升棋艺一样。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

一家跨国公司中国区人工智能大模型从业者告诉21世纪经济报道记者,从技术上来说,OpenAI o1“思路链”技术并不是最新的,但这种应用,让人隐约看到了推理层面的Scaling Law。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI官方也盖章,表示随着强化学习(训练时间计算)和思考时间(测试时间计算)的增加,OpenAI o1的性能会不断提高,扩展这种方法的限制与 LLM 预训练的限制有很大不同。他们将持续研究这里面隐含的新的可能性。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

离AGI有更近一步吗?

业界对于OpenAI o1所呈现出的“思考”能力,是有分歧的。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

一种观点认为,OpenAI o1是人工智能大模型领域总结出Scaling Law之后的最重要进展。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

所谓Scaling Law,是指随着参数量、数据量和计算量的增加,大模型的性能能够不断提高。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而OpenAI o1增加的,是推理过程和思考时间,同样明显提升了模型性能,这打破了大模型进入Scaling Law瓶颈期的担忧。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DCCI互联网数据中心创始人胡延平发表评论称,“草莓”真正开启的角度是让AI开始学会思考,而不只是训练和推理,举一反三,四顾找寻。长思考,慢思考,深度思考。到了草莓这一步,人们对大模型的理解就不能只停留在“对下一个词的猜测、对一个问题的一次性的问答”上了。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

但另一种观点认为,前述说法过于夸张。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

两位AI大模型从业者向21世纪经济报道记者表示,OpenAI o1的确在数学和推理能力方面有大幅度提升,但远远不到突破思考本质的阶段。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“OpenAI o1没有解决统计模型根本的缺陷,本质上还是通过大量学习得出正确的结论,很难理解背后的科学逻辑。”前述人士认为,目前,这种“思路链”更像是一种“假性思考”的状态,无需担心大模型已经有了意识。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“而且,人工智能突破思考本质对人类而言,会是非常危险的事情,短时间内还达不到。”他说。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

IDC中国研究总监卢言霞向21世纪经济报道记者表示,“思路链”不算是突破性进展,之前大模型企业都已经在相关技术上有投入,只是大模型持续演进过程的一步。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

卢言霞并不否认大模型的“自学推理”会是scaling law之后另一种有效的能力提升路径,“只是目前的效果和可落地性还需要时间验证”。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

连Sam Altman本人,都曾在今年3月份的一次采访中强调,AI目前更多的是一套基于数据和数学的系统,能够产生统计上可能的结果,而不是“生物”这种全新的生命形态。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在OpenAI那场震惊世界的宫斗风波中,有一种说法是,OpenAI前首席科学家Ilya Sutskever是因为看到了一些东西(可能是AGI),这让他内心不安,才说服董事会发起了高层人事“地震”。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Sam Altman也曾反复澄清过:“Ilya看到的不是AGI,没有人见到过AGI,我们还没有建造过AGI。”XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在AGI到来之前,OpenAI亟待解决的现实问题其实是“赚钱”。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

近期消息显示,OpenAI已就融资事宜与投资者交流,并考虑调整公司架构,以提高对金主的吸引力。与此同时,OpenAI 首席执行官萨姆•奥特曼正在与几家银行洽谈,以循环贷款的方式筹集50亿美元。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而在商业变现方面,此前曾传出消息,称“草莓”的订阅价格或飙升至2000美元/月,飙涨100倍。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不过,OpenAI o1-preview和o1-mini最终发布的价格并没有发生变化,只是限定了使用次数,o1-preview每周限制使用次数为30条消息。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI o1-mini则是一个较小的模型,在使用与o1相同的高计算强化学习 (RL) pipeline 进行训练后,o1-mini 在许多推理任务上实现了相媲美的性能,同时成本效率显著提高。但o1-mini 在MMLU等任务上的表现则不如GPT-4o,并且由于缺乏广泛的世界认知而在GPQA基准上落后于o1-preview。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不可否认的是,OpenAI每一次都引领了AI大模型的新潮流,且这种野心丝毫不见减弱。最新的发布中,OpenAI表示将在持续迭代的过程中发布OpenAI o1系列的改进版本,o1 及其继任者将为AI在科学、编码、数学和相关领域解锁许多新的用例。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

换而言之,无论o1系列模型是否在历史意义上突破了“思考”本质,OpenAI都在商业层面把其他同类产品一次又一次地甩在了身后,AI大模型的“不进则退”,比其他领域都更悬殊。XHr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

3月17日记者获悉,哈尔滨医科大学公共卫生学院副院长、教授田懋一与副研究员叶鹏鹏团队在一项研究中提出,应将预防老年人跌倒与国家基本公共卫生服务中各项服务流程融合起来。该研究全面梳理了 据法新社巴黎3月15日报道,15日发布的一项新的重要分析称,影响神经系统的疾病——如中风、偏头痛和痴呆症——已经超过心脏病,成为全球范围内导致人们健康损害的主要原因。 据法新社3月18日报道,周一,美国半导体巨头英伟达公司发布了其最新型号的电子芯片,这些芯片旨在支持人工智能(AI)革命,英伟达正努力巩固其作为人工智能领域关键供应商的地位。“我们需要更加强大的 3月21日是世界睡眠日,今年中国主题为“健康睡眠 人人共享”。人的一生约有三分之一的时间是在睡眠中度过,睡眠、运动、营养被视为保障机体正常发育和健康的三大要素。关于睡眠有哪些常见认知误 那些在吃完一顿饱饭后不久就在冰箱里翻找零食的人,可能不是胃口好,而是因为寻找食物的神经元过度活跃的缘故。美国加州大学洛杉矶分校心理学家在老鼠大脑中发现了一个回路:即使它们不饿,也会让它 “人工智能作为数字新基建重点建设方向,前景广阔,大有作为。今年的政府工作报告更首次提出开展‘人工智能+’行动,无疑将为人工智能技术在国内各行各业的广泛应用开启新篇章。”3月22 。

本文链接:OpenAI o1大模型“猎杀时刻”:当AI开始“类思考”,低维争夺结束了http://www.sushuapos.com/show-2-8460-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 2024年服贸会聚焦新质生产力

下一篇: 苹果AI亮相后,AI端侧的大规模落地还有多远?

热门资讯

  • 全国首个煤炭行业能源智算中心在山西建成

    3月18日,记者从山西省人民政府获悉,“山西煤炭工业互联网智算平台”日前在山西联通大数据中心建设完成。该平台由中国联通与山西晋云互联科技有限公

  • 明天氢能荣获国家电网科技进步奖一等奖

    记者3月18日从安徽明天氢能科技股份有限公司(以下简称明天氢能)获悉,国家电网近日向明天氢能及董事长王朝云分别授予科学技术进步奖一等奖,获奖项目为

  • 洞悉竹类植物有了称手“利器”

    竹类植物是竹亚科植物的总称,与水稻、小麦、大麦和燕麦同属于禾本科BOP分支,具有重要的经济、生态和文化价值。为更好地服务竹类植物的系统进化和功

  • 让肺部磁共振成像从“不可看”到“看得清”

    患者只需吸入特制的“氙气”,3.5秒后一幅人体肺部磁共振3D影像就呈现出来。影像中,气体可抵达肺部的位置清晰可见,患者的肺部微结构、气体交换功能情

  • 培育一批专利产业化样板企业

    近日,国家知识产权局等五部门联合印发了《专利产业化促进中小企业成长计划实施方案》(以下简称《实施方案》)。《实施方案》提出,到2025年底,中小企业知

  • 感染新冠会“导致智商下降”吗?

    据英国《泰晤士报》网站3月15日报道,2020年1月,英国帝国理工学院的亚当·汉普希尔与英国广播公司合作,对8万人进行了30分钟的测试,目的是揭示生

  • 雌蛙会向雄蛙“暗送秋波”?这项研究给出了答案

    记者3月21日从安徽师范大学获悉,该校生命科学学院张方教授课题组通过野外自然抱对、控制实验下抱对以及视频回放等实验手段,证实他们前期提出的,眨眼

  • 地下水位上升 生态用水充足——华北地区地下水超采综合治理成效显著

    “截至2023年底,与2018年同期相比,京津冀治理区浅层地下水位平均回升2.59米,深层承压水水位平均回升7.06米。”3月22日世界水日到来之际,水利部水资源

  • 量子互联网:小荷已露尖尖角

    近日,美国纽约州立大学石溪分校科学家菲格罗阿等人在一篇发表于《自然·量子信息》上的论文中称,他们通过把两个独立的光子存储在铷气里,首次在

  • “婴儿香”原来是真的香

    所谓香喷喷的婴儿,到底是源于人们的爱意,还是说确有其香?《通讯·化学》21日一项小型研究首次分析了婴儿和青少年体味化学组成的差异。研究显示

  • 人工纳米流体突触可实现存内计算

    瑞士洛桑联邦理工学院工程学院研究团队制造了一种用于内存的新型纳米流体设备,这使他们第一次能连接两个“人工突触”。该设备为受大脑启发的液体硬

  • “穿上就走”的通用外骨骼面世

    美国佐治亚理工学院机械工程师开发了一种控制机器人外骨骼的通用方法。无需专门训练、特别校准,对复杂算法进行调整后,用户穿上外骨骼就可以直接行走

推荐资讯

  • 日榜
  • 周榜
  • 月榜