·新的音频功能允许用户与ChatGPT对话并立即接收实时响应,也可以在ChatGPT说话时打断。视频和屏幕共享等更高级功能将在晚些时候推出。
7月31日,OpenAI宣布向部分ChatGPT Plus用户推出高级语音模式,并计划于秋季向所有ChatGPT Plus用户开放。
OpenAI正在推动新一代人工智能语音助手的发展。新的音频功能将允许用户与ChatGPT对话并立即接收实时响应,也可以在ChatGPT说话时打断它。语音模式可分辨不同的语音语调所传达的信息。它的声音听起来更自然,并利用声音传达各种不同情绪。
新的语音模式由OpenAI的GPT-4o模型提供支持,该模型结合了语音、文本和视觉功能。为了收集反馈,OpenAI最初向ChatGPT Plus的“一小部分用户”推出语音高级功能,但OpenAI表示,将在今年秋天向所有ChatGPT Plus用户开放。
OpenAI将语音通话体验的推出时间从6月下旬推迟到7月,称需要时间达到发布标准。OpenAI表示已与100多个外部红队测试了GPT-4o的语音功能,涉及45种语言。该公司表示已经建立了几项安全机制,例如为了保护隐私,防止该模型被用来制作深度造假语音,它与配音演员合作创建了四种预设声音,GPT-4o不会模仿或生成其他人的声音。
此前,OpenAI首次推出GPT-4o时,因使用名为“Sky”的声音而遭到强烈反对,这听起来很像女演员斯嘉丽·约翰逊(Scarlett Johansson)的声音。斯嘉丽·约翰逊曾发表声明,称OpenAI曾联系过她,希望允许模型使用她的声音,但她拒绝了。OpenAI否认这是约翰逊的声音,但已暂停使用Sky。
OpenAI也表示,已采用过滤器识别和阻止生成音乐或其他受版权保护的音频的请求,并将文本模型中使用的相同安全机制应用于GPT-4o,防止其违反法律,产生有害内容。“我们设置了护栏来阻止对暴力或受版权保护内容的请求。”此外,视频和屏幕共享等更高级功能将在晚些时候推出。
近日,四川农业大学动物医学院猪病研究中心黄小波课题组在自然指数(Nature index)期刊Journal of Biological Chemistry发表 堆叠、扭曲铜酸盐超导体的示意图。图片来源:物理学家组织网 几十年来,超导体一直是物理学界研究的热点。但这些允许 中新网上海12月19日电 (记者 许婧)上海交通大学分析测试中心实验动物中心新大楼启用仪式19日举行。随着新大楼的落成,一 12月17日,记者从北京协和医院获悉,由该院儿科主编的《儿童风湿免疫病标准数据集》(以下简称数据集)正式发布。专家表示,作为 “忙”,已经成为很多科研人员的常态,他们忙着很多事,唯独很难静下心来忙学问。 中国科学院院士刘忠范将很多被迫忙碌 省教育厅关于下达2024年普通高校“专转本”计划的通知 苏教学函〔2023〕22号 各有关高校: 根据《省教育厅关于做好2024年 。本文链接:OpenAI向部分ChatGPT Plus用户推出高级语音模式http://www.sushuapos.com/show-11-9397-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
上一篇: AI能准确预测男性不育风险
下一篇: 假说获新证:昆虫揭示热带生物多样性之谜