图片来源:美国OpenAI官网
科技日报讯 (记者张佳欣)8月28日,美国人工智能公司OpenAI发布了其所谓“最先进的语音到语音模型”GPT-realtime,以及配套的Realtime API(实时应用程序接口)。
据OpenAI公司介绍,该模型在理解复杂指令、精准调用工具以及生成自然、富有表现力的语音方面表现突出,并在客户服务、教育、个人助理等多种场景中具备广泛应用潜力。
与传统语音模型不同,GPT-realtime新增了Marin与Cedar两种极具特色的语音,同时对原有8种语音进行了全面升级。模型不仅能生成自然流畅的语音,还能够敏锐捕捉笑声等非语言信号,在句子中间自如切换语言,并可根据场景需求灵活调整语气,使语音交互更贴近真实人类沟通。
通过Realtime API,开发者可实现实时语音输入输出,不必再经过繁琐的多模型转换流程。在实际应用中,这套技术可用于客户服务系统,让虚拟助手即时解答问题,提高效率和体验。它还可应用于教育领域,实现语音对话和口语练习。而在个人助理、办公或智能家居场景中,用户能通过语音快速完成安排或查询信息。结合图像或文本输入,开发者还能打造更智能的虚拟助手或机器人系统。
OpenAI表示,GPT-realtime和Realtime API已于8月28日起面向所有付费开发者开放。
国际脑科学计划-细胞普查联盟(BICCN)近日发表了迄今为止最全面详细的小鼠完整大脑细胞类型的特性描述和分类,对大脑的结构 在庞大的维生素家族中,最为人所熟悉的恐怕就是维生素C了。 作为人体必需的维生素之一,维生素C因其具有的超强抗氧化 12月19日,第二届中国气象旅游产业发展大会在河南三门峡召开。来自中国旅游研究院、中国气象局公共气象服务中心、中国科 “忙”,已经成为很多科研人员的常态,他们忙着很多事,唯独很难静下心来忙学问。 中国科学院院士刘忠范将很多被迫忙碌 ·“这项研究似乎说明,长期生活在食品不安全的状况中所带来的危害是没那么容易逆转的。研究也表明,对于那些因 中新网1月1日电 据国家地震台网官方微博消息,中国地震台网自动测定:1月1日15时10分在日本本州西岸近海附近(北纬37.98度,东 。本文链接:OpenAI发布语音模型GPT-realtimehttp://www.sushuapos.com/show-11-25430-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
上一篇: 纯净水会过期吗