OpenAI 预览了语音引擎使用 15 秒语音样本令人信服地克隆人声的能力

OpenAI 预览了其语音引擎技术的当前状态,该技术可以使用 15 秒的语音样本作为输入令人信服地克隆一个人的声音。该技术还可以在翻译语音时将一个人的口音转移到其他口语中,即使目标语言使用非正式或俚语。对于有语音障碍或导致言语不清的疾病(如喉炎)的说话者,语音引擎可以以清晰的声音重复所说的话。

人工智能技术已经发展到可以识别元音、单词和其他词性并可以理解句子要点的地步。语音克隆 AI 识别一个人语音的独特特征,例如口音、情感、时间和重点,然后使用这些特征作为令人信服的克隆来朗读文本。

OpenAI 在其博客页面上展示了令人信服的例子:

语音克隆

使用语音口音克隆进行语音翻译

非正式地说话,或用俚语说话

为哑巴说话

当患有言语障碍时,用一个人原始、清晰的声音说话

由于担心滥用,OpenAI 目前没有向公众发布语音引擎,尽管市场上还有许多其他 AI 语音克隆和语音适应服务。在美国大选期间,这种技术已经被用来制造“假拜登总统”的电话,并在世界各地从公司和个人那里骗钱。不幸的是,一旦潘多拉魔盒被打开,就像用于创建假教皇图像的生成式人工智能图像技术一样,就没有回头路了。

忧心忡忡的读者应与家人和亲密朋友一起使用安全词来验证他们的身份,阅读如何识别诈骗电话,禁止使用金融提供商的语音识别验证,并考虑使用语音转换器来防止在接听未知来电时复制他们的声音。

来源:IT时代网

IT时代网(关注微信公众号ITtime2000,定时推送,互动有福利惊喜)所有原创文章版权所有,未经授权,转载必究。
创客100创投基金成立于2015年,直通硅谷,专注于TMT领域早期项目投资。LP均来自政府、互联网IT、传媒知名企业和个人。创客100创投基金对IT、通信、互联网、IP等有着自己独特眼光和丰富的资源。决策快、投资快是创客100基金最显著的特点。

相关文章
OpenAI 预览了语音引擎使用 15 秒语音样本令人信服地克隆人声的能力

精彩评论