据著名科技网站The Verge报道,OpenAI公司3月29日最新推出了一项名为“语音引擎”(Voice Engine)的人工智能工具,其仅凭一段15秒的声音样本,便能够精准模仿出该人的声音。
OpenAI称,该引擎自2022年底以来一直在开发中,实际已在ChatGPT应用程序的“大声朗读”功能中应用,该功能顾名思义会向用户朗读相关内容。
用户只需利用15秒的样本来训练声音,就可让它以一种“情感和现实”的方式读出喜欢的任何文本。OpenAI表示,它可用于教育目的,将播客翻译成新语言。OpenAI发布的剪辑听起来令人印象深刻,尽管它们有轻微生硬的机器人痕迹。
“语音引擎”展示了一些已经开始应用的例子。如生成更自然、更富有情感的声音;将视频内容翻译成多种语言,以拓宽其全球受众范围。这项技术的一大特色是,在翻译过程中能够保留演讲者原有的口音特征,为翻译增添了更多真实感和个性化色彩。
“语音引擎”还可为语言障碍者提供支持,例如开发针对语言障碍者的治疗应用,为有特殊学习需求的人提供教育辅助,使用户能选择最能体现其个性的声音,并且对那些使用多种语言的用户,保持在各种语言中声音的一致性。“语音引擎”使用一位年轻患者之前为学校项目录制的视频音频,成功恢复了她因血管性脑瘤而失去的流畅语言能力。
OpenAI目前并未立即向市场全面推广,而是选择与少数早期测试者谨慎地合作,共同探索“语音引擎”的应用可能和潜在风险。
“语音引擎”目前仅处于有限测试阶段,主要原因是担心被滥用。OpenAI指出,“语音引擎”可能导致语音身份验证措施出现问题,以及让大众在误以为自己与熟人通话的情况下涉入骗局。
OpenAI表示希望进行更多研究,以确保此类工具无法在未经同意的情况下用于传播错误信息和复制声音。
据著名科技网站The Verge报道,OpenAI公司3月29日最新推出了一项名为“语音引擎”(Voice Engine)的人工智能工具,其仅凭一段15秒的声音样本,便能够精准模仿出该人的声音。
OpenAI称,该引擎自2022年底以来一直在开发中,实际已在ChatGPT应用程序的“大声朗读”功能中应用,该功能顾名思义会向用户朗读相关内容。
用户只需利用15秒的样本来训练声音,就可让它以一种“情感和现实”的方式读出喜欢的任何文本。OpenAI表示,它可用于教育目的,将播客翻译成新语言。OpenAI发布的剪辑听起来令人印象深刻,尽管它们有轻微生硬的机器人痕迹。
“语音引擎”展示了一些已经开始应用的例子。如生成更自然、更富有情感的声音;将视频内容翻译成多种语言,以拓宽其全球受众范围。这项技术的一大特色是,在翻译过程中能够保留演讲者原有的口音特征,为翻译增添了更多真实感和个性化色彩。
“语音引擎”还可为语言障碍者提供支持,例如开发针对语言障碍者的治疗应用,为有特殊学习需求的人提供教育辅助,使用户能选择最能体现其个性的声音,并且对那些使用多种语言的用户,保持在各种语言中声音的一致性。“语音引擎”使用一位年轻患者之前为学校项目录制的视频音频,成功恢复了她因血管性脑瘤而失去的流畅语言能力。
OpenAI目前并未立即向市场全面推广,而是选择与少数早期测试者谨慎地合作,共同探索“语音引擎”的应用可能和潜在风险。
“语音引擎”目前仅处于有限测试阶段,主要原因是担心被滥用。OpenAI指出,“语音引擎”可能导致语音身份验证措施出现问题,以及让大众在误以为自己与熟人通话的情况下涉入骗局。
OpenAI表示希望进行更多研究,以确保此类工具无法在未经同意的情况下用于传播错误信息和复制声音。
记者从国家航天局获悉,3月20日8时31分,探月工程四期鹊桥二号中继星由长征八号遥三运载火箭在中国文昌航天发射场成功发射升空。科技日报记者 付毅飞 摄火箭飞行24分钟后,星箭分离,将鹊 3月18日,伴随着搬运车的轰鸣声,全国首个大规模清洁能源特高压直流输电工程的送端±800千伏特高压祁连换流站迎来了一位“新成员”——1号调相机转子,该换流站第7次年度检修工作 记者从近日举办的新疆筹建融合算力中心研讨会上获悉,新疆将构建具备国家级算力水平的涵盖超算、智算的融合算力中心。到2024年底,建成超算算力(FP64)不低于200P Flops、智算算力(FP16)不低于400P F 据一项在本周举行的美国心脏协会会议上提交的新研究,每天进食时间控制在8小时内的间歇性禁食方法可能与心脏病死亡风险上升相关。近年来越来越流行的间歇性禁食指限制进食时间,在每天或每周的 30台发动机助进阶版“鹊桥”升空 中新社西安3月20日电 (记者 张一辰)3月20日8时31分,长征八号遥三运载火箭在中国文昌航天发射场顺利升空,成功将“鹊桥二号”卫星送入预定轨道。作为公共中继星平台,“鹊桥二号” 聊到安卓电话的拍照,大部分用户还是比较认可的,而在与iPhone电话的对比中,用户也普遍以为安卓电话的拍照水平要比iPhone更好,当然这一说法也并非空穴来风,其背后的原因直接而明确。首先,硬件配置的竞争 。本文链接:“语音引擎”可从15秒样本复制原声http://www.sushuapos.com/show-2-4523-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
上一篇: 最广泛灵长类动物大脑研究结果发布
下一篇: 新技术提升嘉定白蒜品质产量