设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

重磅!类人速度超快语音响应!OpenAI推出新旗舰模型GPT-4o,图文音频手机AI搞定

发布时间: 来源:

北京时间周二凌晨1点,自年初“文生视频模型”Sora后许久未给市场带来惊喜的OpenAI举行春季发布会。公司首席技术官米拉·穆拉蒂(Mira Murati)向外界展现了多项与ChatGPT有关的更新。简要来说,OpenAI的发布会主要干了两件事情:发布最新GPT-4o多模态大模型,相较于GPT-4 Trubo速度更快、价格也更便宜。tVt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

第二件事情就是宣布,ChatGPT的免费用户也能用上最新发布的GPT-4o模型(更新前只能使用GPT-3.5),来进行数据分析、图像分析、互联网搜索、访问应用商店等操作。这也意味着GPT应用商店的开发者,将面对海量的新增用户。tVt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

当然,付费用户将会获得更高的消息限制(OpenAI说至少是5倍)。当免费用户用完消息数量后,ChatGPT将自动切换到GPT-3.5。tVt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

另外,OpenAI将在未来1个月左右向Plus用户推出基于GPT-4o改进的语音体验,目前GPT-4o的API并不包含语音功能。苹果电脑用户将迎来一款为macOS设计的ChatGPT桌面应用,用户可以通过快捷键“拍摄”桌面并向ChatGP提问,OpenAI表示,Windows版本将在今年晚些时候推出。tVt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

值得一提的是,米拉·穆拉蒂在一次直播活动中表示:“这是我们第一次在易用性方面真正向前迈出了一大步。”tVt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

tVt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

图片来源:视频截图tVt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI由微软支持,目前投资者对其估值已超过800亿美元。该公司成立于2015年,目前正面临在生成式AI市场保持领先地位的压力,同时需要想方设法实现盈利,因为其在处理器和基础设施建设上投入了大量资金,以构建和训练其模型。tVt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

实时口译、读取用户情绪等

米拉·穆拉蒂强调了GPT-4o在实时语音和音频功能方面必要的安全性,称OpenAI将继续部署迭代,带来所有的功能。tVt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在演示中,OpenAI研究主管Mark Chen掏出手机打开ChatGPT,用语音模式Voice Mode现场演示,向GPT-4o支持的ChatGPT征询建议。GPT的声音听起来像一位美国女性,当它听到Chen过度呼气时,它似乎从中察觉到了他的紧张。然后说“Mark,你不是吸尘器”,告诉Chen要放松呼吸。如果有些大变化,用户可以中断GPT,GPT-4o的延迟通常应该不会超过两三秒。tVt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

tVt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

图片来源:视频截图tVt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

另一项演示中,OpenAI的后训练团队负责人Barret Zoph在白板上写了一个方程式3x+1=4,ChatGPT给他提示,引导他完成每一步解答,识别他的书写结果,帮助他解出了X的值。这个过程中,GPT充当了实时的数学老师。GPT能够识别数学符号,甚至是一个心形。tVt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

tVt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

图片来源:视频截图tVt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

应社交媒体X的用户请求,米拉·穆拉蒂现场对ChatGPT说起了意大利语。GPT则将她的话翻译成英语,转告Zoph和Chen。听完米拉·穆拉蒂说的意大利语,GPT翻译为英文告诉Chen:“Mark,她(米拉·穆拉蒂)想知道鲸鱼会不会说话,它们会告诉我们什么?”tVt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

tVt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

图片来源:视频截图tVt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI称,GPT-4o还可以检测人的情绪。在演示中,Zoph将手机举到自己面前正对着脸,要求ChatGPT告诉他自己长什么样子。最初,GPT参考了他之前分享的一张照片,将他识别为“木质表面”。经过第二次尝试,GPT给出了更好的答案。tVt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

GPT注意到了Zoph脸上的微笑,对他说:“看起来你感觉非常快乐,喜笑颜开。”有评论称,这个演示显示,ChatGPT可以读取人类的情绪,但读取还有一点困难。tVt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

tVt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

图片来源:视频截图tVt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI的高管表示,GPT-4o可以与代码库交互,并展示了它根据一些数据分析图表,根据看到的内容对一张全球气温图得出一些结论。OpenAI称,基于GPT-4o的ChatGPT文本和图像输入功能将于本周一上线,语音和视频选项将在未来几周内推出。tVt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

据外媒援引PitchBook的数据,2023年,近700笔生成式AI交易共投入创纪录的291亿美元,较上一年增长逾260%。据预测,该市场将在未来十年内突破1万亿美元收入大关。业内一些人对于未经测试的新服务如此迅速地推向市场表示担忧,而学术界和伦理学家则对这项技术传播偏见的倾向感到忧虑。tVt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

ChatGPT自2022年11月推出以来,便打破了当时最快增长消费类应用的历史记录,如今每周活跃用户已接近1亿。OpenAI表示,超过92%的《财富》500强企业都在使用该平台。tVt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

tVt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

图片来源:CNBC报道截图tVt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在周一的活动上,穆拉蒂表示,OpenAI希望“消除科技中的一些神秘感”。她还说,“未来几周,我们将向所有人推出这些功能。”tVt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在直播活动结束时,穆拉蒂感谢了英伟达首席执行官黄仁勋及其公司提供的必要图形处理单元(GPU),这些GPU为OpenAI的技术提供了动力。她说,“我只想感谢出色的OpenAI团队,同时也要感谢黄仁勋和英伟达团队为我们带来最先进的GPU,让今天的演示成为可能。”tVt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

最快232毫秒响应音频输入

OpenAI官网介绍,GPT-4o中的o代表意为全能的前缀omni,称它向更自然的人机交互迈进了一步,因为它接受文本、音频和图像的任意组合作为输入内容,并生成文本、音频和图像的任意组合输出内容。tVt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

tVt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

图片来源:OpenAI官网截图tVt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

除了API的速度更快、成本大幅下降,OpenAI还提到,GPT-4o可以在最快232毫秒的时间内响应音频输入,平均响应时间为320毫秒,这与人类在对话中的响应时间相似。它在英语文本和代码方面的性能与GPT-4 Turbo的性能一致,并且在非英语文本方面的性能有了显著提高。tVt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI介绍,与现有模型相比,GPT-4o在视觉和音频理解方面尤其出色。以前GPT-3.5和GPT-4用户以语音模式Voice Mode与ChatGPT对话的平均延迟时间为2.8秒和5.4秒,因为OpenAI用了三个独立的模型实现这类对话:一个模型将音频转录为文本,一个模型接收并输出文本,再有一个模型将该文本转换回音频。这个过程意味着,GPT丢失了大量信息,它无法直接观察音调、多个说话者或背景噪音,也无法输出笑声、歌唱或表达情感。tVt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而GPT-4o的语音对话是OpenAI跨文本、视觉和音频端到端训练一个新模型的产物,这意味着所有输入和输出都由同一神经网络处理。OpenAI称,GPT-4o是其第一个结合所有这些模式的模型,因此仍然只是浅尝辄止地探索该模型的功能及其局限性。tVt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

上周曾有消息称,OpenAI将发布基于AI的搜索产品,但上周五OpenAI的CEO Sam Altman否认了该消息,称本周一演示的既不是GPT-5,也不是搜索引擎。这意味着OpenAI再一次没有像市场爆料的时间线那样推出AI搜索。此后有媒体称,OpenAI的新产品可能是一个具备视觉和听觉功能的全新多模态AI模型,且具有比目前聊天机器人更好的逻辑推理能力。tVt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

(来源:每日经济新闻 作者:毕陆名)tVt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

3月18日,中国经济信息社(以下简称中经社)垂直领域数字化应用系统发布仪式在北京举行。在发布仪式上,锚定建设“国家级经济信息旗舰”的目标,中经社推出了八大数字化应用系统。中经社此次发布的行 北京时间凌晨4点至6点,英伟达联合创始人兼CEO黄仁勋发表主题演讲《见证AI的变革时刻》,正式拉开了2024年英伟达GTC大会的序幕。黄仁勋宣布,正式推出名为Blackwell的新一代AI图形处理器(G 记者3月17日从浙江大学获悉,该校医学院附属第二医院王良静教授团队、附属邵逸夫医院陈淑洁主任医师团队联合研究发现,一种肠道菌群产生的小分子代谢物吲哚丙酸,可以增强抗癌药物抗PD-1单抗对结 记者从近日举办的新疆筹建融合算力中心研讨会上获悉,新疆将构建具备国家级算力水平的涵盖超算、智算的融合算力中心。到2024年底,建成超算算力(FP64)不低于200P Flops、智算算力(FP16)不低于400P F 记者3月21日从安徽农业大学获悉,该校生命科学学院韩毅教授课题组与国内外专家合作,发现了植物避盐性的关键基因。该研究对于提高植物耐盐性,帮助盐碱地下的农作物稳产具有重要理论指导意义。相   盲视技术已在猴子身上见效!马斯克脑机接口公司新目标:让盲人重见光明  澎湃新闻记者 吴遇利  Neuralink新技术或将造福数千万名失明人士。  当地时间3月21日,特斯拉CEO埃隆・马斯克在社交平台X(原推特)发文称, 。

本文链接:重磅!类人速度超快语音响应!OpenAI推出新旗舰模型GPT-4o,图文音频手机AI搞定http://www.sushuapos.com/show-2-5861-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 游戏服务,何时长成虎牙的第二增长曲线?

下一篇: 重磅!南财发布《活跃数据交易机构金融场景数据产品分析报告》

热门资讯

推荐资讯

  • 恒为科技并购“转弯”:现金+增资,股权降至51%

      中新经纬3月27日电 (张澍楠)从拟拿下75%股份到不少于51%股权,从“发行股份+现金+募资”改“现金+增资”,恒为科技历时近半年的并购“大转弯”。  现金+增资  时间拉回

  • 外媒:日本计划解除煤炭火力发电限制

      中新经纬3月27日电 据日经中文网报道,日本政府作为应对中东局势动荡的紧急措施,将解除对煤炭火力发电的运行限制。  报道称,此前为减少二氧化碳排放而被限制运行的老旧设

  • 外媒:经合组织将韩国经济增长预期下调至1.7%

      中新经纬3月27日电 据韩联社26日报道,经济合作与发展组织(OECD)将韩国今年的经济增长预期由2.1%下调至1.7%,并将通胀预期上调0.9个百分点至2.7%。  据韩国财政经济部(下

  • 2025年营收超72亿!从卫龙年报看魔芋品类的“狂飙”

      当“低卡”“低糖”“高纤维”成为年轻人零食消费的关键词,一种来自深山、曾经默默无闻的食材――魔芋,正在完成一场华丽的逆袭。  从火锅里的配角,到年轻人手边的“解馋

  • 2025年中国新设个体工商户1619.4万户

      中新经纬3月26日电 据国家市场监管总局微信公众号26日消息,近日,国家市场监管总局公布数据显示,2025年全国新设个体工商户1619.4万户,总体发展平稳,为繁荣消费、稳定就业、服

  • 商务部:加强对跨国公司在华投资项目服务保障

      中新经纬3月26日电 商务部新闻发言人何咏前26日表示,加强对跨国公司在华投资项目服务保障,滚动更新重点外资项目清单,在数据跨境流动、研发创新、人才引进等方面给予大力支

  • 瑞银:2027年初黄金目标价5900美元

      中新经纬3月26日电 (罗琨)26日,中新经纬获悉,瑞银财富管理投资总监办公室(CIO)发表机构观点称,黄金仍将发挥对冲作用,预期黄金2027年初目标价将在每盎司5900美元。  本周

  • 2年、5年和10年,人形机器人的“ChatGPT时刻”何时到来?

      中新经纬3月25日电 (薛宇飞 王玉玲)“你们觉得人形机器人的‘ChatGPT时刻’还有几年?”当主持人在博鳌亚洲论坛2026年年会抛出这个问题时,台上的几位人形机器人公司负责人

  • 中上协:2月末全市场总市值再创新高,同比增34%

      中新经纬3月25日电 25日,“中国上市公司协会”微信号发布统计月报。  截至2026年2月28日,境内股票市场(以下简称“全市场”)共有上市公司5492家,沪、深、北证券交易所分

  • 纳指收跌0.84%,国际油价大涨超4%

      中新经纬3月25日电 美股走势较为疲软。道指、标普500指数盘中数度翻红,但收盘集体走弱。道指收跌0.18%,纳指跌0.84%,标普500指数跌0.37%。  来源:Wind  “目前中东局势

  • 林毅夫:看到“内卷”不用太紧张 必然会出现

      中新经纬3月24日电 (薛宇飞)“我们看到‘内卷’也不用太紧张,因为我们知道这是必然会出现的,就像人不断在长大,原来的衣服就会不合适,要买新的衣服一样,‘内卷’也是同样的。

  • 日榜
  • 周榜
  • 月榜