设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

发布时间: 2024-04-01 14:24:20 来源: 量子位

还帮助病患恢复了声音DOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

克雷西 发自 凹非寺DOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

量子位 | 公众号 QbitAIDOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI雪藏的新产品——语音合成引擎Voice Engine,终于被正式揭幕。DOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

有了它,只需15秒的语音样本,就能克隆出一个人的声音,而且还能跨越语言!DOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

APP版ChatGPT中的语音对话功能,也正是由这项技术所驱动DOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

效果如何?先来听段DEMO:DOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Salt also makes sure we stay hydrated which means there is enough water in our body for it to properly function.
盐分也可以保持人体内的水分,确保其满足正常功能的需要。DOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

【音频效果请移步公众号】DOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而OpenAI通告显示,他们在2022年底就已经开发出了这项技术,但出于安全考虑一直没有正式发布。DOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这次,OpenAI终于官宣了Voice Engine,并展示了小规模测试中的几个应用案例。DOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

比如,一家非营利医疗机构就利用这项技术,为一名年轻的病人恢复了她的声音。DOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

另外值得一提的是,去年爆火的视频翻译软件HeyGen,采用的语音引擎也正是Voice Engine。DOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

那么,这次OpenAI还展现了哪些效果,下面就来一睹为快。DOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

用AI帮助病患恢复声音

首先是利用基础的语音合成能力,为儿童等不具备文字阅读能力的群体提供阅读辅助DOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

比如一家儿童教育技术公司,就一直在使用Voice Engine来给编写好的画外音内容配音。DOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DEMO中生成的大段内容,都是基于这样一段15秒的样本:DOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

【音频效果请移步公众号】DOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

然后,就可以合成相同音色的长段语音:DOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

【音频效果请移步公众号】DOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

再来看看HeyGen中用到的的语音翻译技术,原始素材是一段英语的音频:DOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

【音频效果请移步公众号】DOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

它被用原始的音色,翻译成了普通话、法语、德语等多种语言。DOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

忽略译文的质量,只听声音,中文的效果是这样的:DOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

【音频效果请移步公众号】DOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

音色保持的还算不错,不过腔调很明显一听就是外国人在说中文。DOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

至于这到底是个bug还是个feature,就见仁见智了(手动狗头)。DOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

此外,一款名为Livox的残障人士辅助应用,也利用Voice Engine为不能说话的残障人士“发出声音”——DOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在有了Voice Engine之后,TA们可以选择专属的真人音色,而不再是机械感明显的合成音,并且在各种语言之间都能保持音色的一致性。DOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不只是帮助残障人士拥有自己的声音,Voice Engine还可以为因疾病导致声音发生在重大改变的人群,恢复患病之前声音,只要有以前的声音样本就能实现。DOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

一名年轻的患者因罹患血管性脑肿瘤,失去了流利讲话的能力,说话变成了这样:DOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

【音频效果请移步公众号】DOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

医生从她所在学校录制的视频中提取到了她患病前的声音作为样本,在Voice Engine的帮助下为她恢复了此前的音色。DOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

【音频效果请移步公众号】DOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

此次发布的案例,特别是为不便人士提供帮助的场景受到了不少好评,但也有网友对这项技术的滥用表达了担忧。DOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

安全问题需要全社会共同关注

实际上,安全问题也是OpenAI迟迟未将这项技术公之于众的主要考量。DOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

出于安全考虑,前面案例的开发者都经过了OpenAI的严格筛选,并且需要承诺遵守使用协议。DOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这些开发者被要求必须明确说明声音是合成的,并且设定了黑名单以防止克隆公众人物声音。DOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

此外,OpenAI还向合成的声音中添加了水印,以便出现问题时可以进行检测监控,同时呼吁人们采取措施共同应对这一问题:DOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  • 在银行等敏感信息的安全验证措施中逐步淘汰语音验证方式
  • 探索AI时代下个人声音的保护措施
  • 教育公众理解AI的局限性,并了解其被用于欺诈的可能
  • 加速开发跟踪溯源技术,让人们能够清晰辨别出真人和AI
OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

参考链接:
https://openai.com/blog/navigating-the-challenges-and-opportunities-of-synthetic-voicesDOq速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

国际天文学家团队绘制了迄今最大的三维宇宙地图,记录了大约130万个活跃类星体在空间和时间上的位置。它将成为探测类星体、暗物质晕和超大质量黑洞的强大工具。发表在最新一期《天体物理学杂 “当时是怎样选中低空经济这个领域,并且来深圳发展的?”面对这个关乎事业发展的问题,“95后”台青张晏纶坦言,“这是一场面试带来的惊喜。”张晏纶来自台湾台中市,本科就读于台湾成功大学机械工程 记者3月20日从中国科学技术大学获悉,该校郭光灿院士团队在量子态分辨研究中取得重要进展。研究组在最小资源消耗的量子态分辨问题中首次提出了全局最优自适应策略,并发展了自适应集体测量实验 记者3月21日获悉,商汤科技与遥感数据平台吉林一号网、四维地球、星图地球等展开合作,此举标志着“SenseEarth智能遥感云”平台数据源全面升级,将为行业用户提供更完善、精准的一体化的高分辨率 21世纪经济报道记者 石恩泽 深圳报道操作系统似乎对地理入迷。鸿蒙和深圳,就像Windows和西雅图,也似Linux和赫尔辛基。这是地理与技术的紧密交融。深圳,可以说是鸿蒙的诞生之地,在全球科 3月22日,在2024低碳建筑产业论坛上,北京首例负碳示范建筑——首程时代中心负碳示范建筑正式亮相。活动现场,中国建筑节能协会、北京绿色交易所分别授予首程时代中心负碳示范建筑“零 。

本文链接:OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用http://www.sushuapos.com/show-2-4435-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: GPT4单项仅7.1分,揭露大模型写代码三大短板,最新基准测试来了

下一篇: 我的领导马斯克:痛恨开会,不要非技术中层,推崇裁员

热门资讯

  • “桃花癫”是种病,得治

    民俗有言:桃花开,痴子忙。昨日,一大学生患“桃花癫”登上微博热搜,引发热议。该大学生认为周围女生都喜欢自己,并向全校的女生分别告白。不仅如此,由于精

  • 让肺部磁共振成像从“不可看”到“看得清”

    患者只需吸入特制的“氙气”,3.5秒后一幅人体肺部磁共振3D影像就呈现出来。影像中,气体可抵达肺部的位置清晰可见,患者的肺部微结构、气体交换功能情

  • 新AI系统可提供足球制胜战术

    未来的足球场,人工智能(AI)当“大脑”?《自然·通讯》19日发表一项来自谷歌深度思维的最新成果,研究团队报告了一个名为“TacticAI”的系统,能在足

  • 我国首个适应高寒气候肉羊品种通过鉴定

    记者19日从兰州大学获悉,天华肉羊通过国家畜禽遗传资源委员会审定鉴定,成为我国首个适应高寒气候的肉羊品种。该品种由兰州大学草地农业科技学院李发

  • 239万的无人驾驶航空器淘宝上架,人人可以“打飞的”还有多远

      239万的无人驾驶航空器淘宝上架,人人可以“打飞的”还有多远  239万元/架的无人驾驶载人航空器也看上了电商渠道。  3月18日,亿航智能设备(广州)有限公司(下称“亿航

  • CRISPR能消除培养细胞中艾滋病病毒

    荷兰阿姆斯特丹大学医学院科学家开展的一项新研究证明,利用最新CRISPR-Cas基因编辑技术,能消除实验室中受感染细胞内所有艾滋病病毒(HIV)的痕迹,为治愈

  • 专家:警惕常见睡眠认知误区

    3月21日是世界睡眠日,中国主题为“健康睡眠 人人共享”。近日发布的《2023年中国居民睡眠白皮书》显示,我国居民平均睡眠时长6.75小时,平均在零点后入

  • 研究:“16:8”间歇性禁食可能与心脏病死亡风险上升相关

    据一项在本周举行的美国心脏协会会议上提交的新研究,每天进食时间控制在8小时内的间歇性禁食方法可能与心脏病死亡风险上升相关。近年来越来越流行

  • 小龙虾能将锂离子转入食物链

    从手机到手表再到电动汽车,锂离子充电电池为众多设备提供动力。但随着消费者丢弃电子产品的增加,越来越多的锂可能会进入环境。研究人员在美国化学会

  • 30台发动机助进阶版“鹊桥”升空

      30台发动机助进阶版“鹊桥”升空  中新社西安3月20日电 (记者 张一辰)3月20日8时31分,长征八号遥三运载火箭在中国文昌航天发射场顺利升空,成功将“鹊桥二号”卫星送入

  • GPU持续升级 如何应对算力“贫富差距”

    英伟达的GPU又升级了。3月19日,英伟达CEO黄仁勋发布了最新的B200算力芯片GPU,FP8精度下的训练性能是上一代的2.5倍,FP4精度下的推理性能更是达到了上

  • 甘蓝育种大突破:“一步法”快速创制不育系

    3月24日,记者从中国农业科学院获悉,该院蔬菜花卉研究所甘蓝类蔬菜遗传育种创新团队,开发了快速创制细胞质雄性不育系的新方法——“一步法

推荐资讯

  • 日榜
  • 周榜
  • 月榜