设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

发布时间: 来源: 量子位

还帮助病患恢复了声音044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

克雷西 发自 凹非寺044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

量子位 | 公众号 QbitAI044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI雪藏的新产品——语音合成引擎Voice Engine,终于被正式揭幕。044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

有了它,只需15秒的语音样本,就能克隆出一个人的声音,而且还能跨越语言!044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

APP版ChatGPT中的语音对话功能,也正是由这项技术所驱动044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

效果如何?先来听段DEMO:044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Salt also makes sure we stay hydrated which means there is enough water in our body for it to properly function.
盐分也可以保持人体内的水分,确保其满足正常功能的需要。044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

【音频效果请移步公众号】044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而OpenAI通告显示,他们在2022年底就已经开发出了这项技术,但出于安全考虑一直没有正式发布。044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这次,OpenAI终于官宣了Voice Engine,并展示了小规模测试中的几个应用案例。044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

比如,一家非营利医疗机构就利用这项技术,为一名年轻的病人恢复了她的声音。044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

另外值得一提的是,去年爆火的视频翻译软件HeyGen,采用的语音引擎也正是Voice Engine。044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

那么,这次OpenAI还展现了哪些效果,下面就来一睹为快。044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

用AI帮助病患恢复声音

首先是利用基础的语音合成能力,为儿童等不具备文字阅读能力的群体提供阅读辅助044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

比如一家儿童教育技术公司,就一直在使用Voice Engine来给编写好的画外音内容配音。044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DEMO中生成的大段内容,都是基于这样一段15秒的样本:044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

【音频效果请移步公众号】044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

然后,就可以合成相同音色的长段语音:044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

【音频效果请移步公众号】044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

再来看看HeyGen中用到的的语音翻译技术,原始素材是一段英语的音频:044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

【音频效果请移步公众号】044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

它被用原始的音色,翻译成了普通话、法语、德语等多种语言。044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

忽略译文的质量,只听声音,中文的效果是这样的:044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

【音频效果请移步公众号】044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

音色保持的还算不错,不过腔调很明显一听就是外国人在说中文。044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

至于这到底是个bug还是个feature,就见仁见智了(手动狗头)。044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

此外,一款名为Livox的残障人士辅助应用,也利用Voice Engine为不能说话的残障人士“发出声音”——044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在有了Voice Engine之后,TA们可以选择专属的真人音色,而不再是机械感明显的合成音,并且在各种语言之间都能保持音色的一致性。044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不只是帮助残障人士拥有自己的声音,Voice Engine还可以为因疾病导致声音发生在重大改变的人群,恢复患病之前声音,只要有以前的声音样本就能实现。044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

一名年轻的患者因罹患血管性脑肿瘤,失去了流利讲话的能力,说话变成了这样:044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

【音频效果请移步公众号】044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

医生从她所在学校录制的视频中提取到了她患病前的声音作为样本,在Voice Engine的帮助下为她恢复了此前的音色。044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

【音频效果请移步公众号】044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

此次发布的案例,特别是为不便人士提供帮助的场景受到了不少好评,但也有网友对这项技术的滥用表达了担忧。044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

安全问题需要全社会共同关注

实际上,安全问题也是OpenAI迟迟未将这项技术公之于众的主要考量。044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

出于安全考虑,前面案例的开发者都经过了OpenAI的严格筛选,并且需要承诺遵守使用协议。044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这些开发者被要求必须明确说明声音是合成的,并且设定了黑名单以防止克隆公众人物声音。044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

此外,OpenAI还向合成的声音中添加了水印,以便出现问题时可以进行检测监控,同时呼吁人们采取措施共同应对这一问题:044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  • 在银行等敏感信息的安全验证措施中逐步淘汰语音验证方式
  • 探索AI时代下个人声音的保护措施
  • 教育公众理解AI的局限性,并了解其被用于欺诈的可能
  • 加速开发跟踪溯源技术,让人们能够清晰辨别出真人和AI
OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

参考链接:
https://openai.com/blog/navigating-the-challenges-and-opportunities-of-synthetic-voices044速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

日本《朝日新闻》近日发表题为《深海之光——极端环境是创意宝库》的文章,作者是樱井林太郎,编译如下:在被称为最后未开垦地的深海,有着低温、高压、黑暗等极限环境。能否从这些极限环 据《自然》20日消息称,天文学家对91对恒星所作的光谱分析显示,大约每12个恒星中就有一个可能吞噬了一个行星。在吞噬一个行星后,恒星的化学构成可能发生改变,这个过程被称为“行星吸收”。通过比 英国科学家首次创造了一个新颖的实验平台,即“量子龙卷风”。它能模拟超流体氦中的黑洞,使研究人员能更详细地观察类似黑洞的行为以及与周围环境的相互作用。通过对超流体氦表面微波动力学的观 记者从国家航天局获悉,3月20日8时31分,探月工程四期鹊桥二号中继星由长征八号遥三运载火箭在中国文昌航天发射场成功发射升空。科技日报记者 付毅飞 摄火箭飞行24分钟后,星箭分离,将鹊 3月22日消息,美国司法部对iPhone提起诉讼,声称其苹果生态系统构成垄断。司法部表示,iPhone将苹果生态系统视为一种垄断,以牺牲消费者、开发者和竞争对手的利益为代价,推动公司估值的飙升。司法部还指 作为月之暗面的创始人,杨植麟常把他的AGI梦想形容为“登月计划”,长文本就是这个伟大计划的第一步。但现在,随着Kimi的爆火出圈,赛道瞬间变得拥挤,24小时内,阿里、360、百度紧急“出手”,纷 。

本文链接:OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用http://www.sushuapos.com/show-2-4435-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: GPT4单项仅7.1分,揭露大模型写代码三大短板,最新基准测试来了

下一篇: 我的领导马斯克:痛恨开会,不要非技术中层,推崇裁员

热门资讯

推荐资讯

  • 众泰汽车信披不及时收监管函

      中新经纬3月27日电 27日下午,众泰汽车公告,收到深交所监管函。  监管函显示,根据众泰汽车重整计划安排,公司应分别于2023年12月21日、2024年12月21日、2025年12月21日、20

  • 深证成指收涨1.13%,锂电池概念持续走强

      中新经纬3月27日电 27日,A股三大指数低开高走,深证成指领涨。截至收盘,上证指数涨0.63%,报3913.72点;深证成指涨1.13%,报13760.37点;创业板指涨0.71%,报3295.88点。  Wind截图

  • 沐曦股份上市后首份年报:大幅减亏,但仍亏近8亿

      中新经纬3月26日电 26日晚间,“国产GPU第二股”沐曦股份披露上市后首份年报。  2025年,沐曦股份实现营收16.44亿元,同比增长121.26%;归属于上市公司股东的净利润为亏损7.8

  • 商务部:扩大服务出口,拓展服务消费新空间

      中新经纬3月26日电 商务部新闻发言人何咏前表示,将更好优化入境消费环境,扩大服务出口,拓展服务消费新空间。  26日,商务部召开例行新闻发布会。会上有记者提问:近日,商务部

  • 古茗发布2025年业绩:营收129亿元,门店数超1.3万家

      3月25日,古茗发布2025年度业绩报告,门店数、单店业绩与收入及利润均呈稳定增长。  财报显示,2025年,古茗实现总收入约129亿元,同比增长46.9%;经调整利润(非国际财务报告准则

  • 9连涨后2连跌停,*ST新潮称“无应披未披事项”

      中新经纬3月25日电 25日晚间,*ST新潮发布《股票交易异常波动公告》称,截至公告披露日,除已披露事项外,不存在应披露而未披露的重大信息  Wind显示,近日,*ST新潮股价走出“过

  • 徐必久任生态环境部副部长

      中新经纬3月25日电 人社部网站25日消息,国务院任免国家工作人员。人社部网站截图  任命徐必久为生态环境部副部长;任命刘海波为国家机关事务管理局副局长;任命章冬梅(女)

  • 洲际油气高息借钱,还压上核心资产

      中新经纬3月25日电 (张澍楠)贷款利率10.5%、核心资产担保、被抵押主体资产高于合并报表总资产,这些字眼出现在洲际油气下属子公司贷款公告中。  上交所网站截图  该

  • 外媒:英国商业活动增长几近停滞

      中新经纬3月25日电 据英国《金融时报》中文网24日消息,美伊局势推高成本,英国商业活动增长几近停滞。  报道指出,一项备受关注的调查显示,英国商业活动正以自9月以来最慢

  • 石油紧缩,已经影响到韩国泡面了

      中新经纬3月24日电 据彭博社报道,中东原油短缺日益严重,影响已经传递到了韩国的食品行业。  日前,由于中东局势紧张导致石脑油供应不稳,韩国将于下月起对石脑油出口实施管

  • 报告:AI研发岗位供给偏紧,超2万元月薪暂未弥补人才稀缺

      中新经纬3月24日电 《2026年春招市场行情周报(第四期)》(简称报告)指出,新质领域技术岗位面临人才缺口,AI工程师需供比3:1。  2026春招市场,招聘求职双活跃  智联招聘

  • 日榜
  • 周榜
  • 月榜