谷歌推出AI视频对口型技术 模仿说话者声音、语气和面部表情

原标题:谷歌推出 AI 视频对口型技术:根据翻译语言改变人物说话方式,但不开放使用

5 月 11 日消息,在 2023 I / O 开发者大会上,谷歌宣布正在开发一项名为 Universal Translator 的实验技术。

顾名思义,该工具旨在将视频从一种语言翻译成另一种语言,同时保留整体基调和氛围。这意味着该技术不仅可以将音频从一种语言翻译成另一种语言,还可以模仿说话者的声音、语气和面部表情,人物说话视频会根据目标语言的发音同步改变口型。

如上图所示,Universal Translator 首先检测单词并进行翻译。然后,它会检查说话者的语气以及他们强调的内容。结合这两个方面后,它会生成目标语言的语音。最后,它会根据 AI 生成的语音的发音同步视频中说话者的口型。

考虑到此工具可能被滥用来创建虚假视频,谷歌表示将限制对 Universal Translator 的访问。因此,只有谷歌授权合作伙伴才能将其用于建设性项目,而普通用户无法使用。

来源:IT之家

IT时代网(关注微信公众号ITtime2000,定时推送,互动有福利惊喜)所有原创文章版权所有,未经授权,转载必究。
创客100创投基金成立于2015年,直通硅谷,专注于TMT领域早期项目投资。LP均来自政府、互联网IT、传媒知名企业和个人。创客100创投基金对IT、通信、互联网、IP等有着自己独特眼光和丰富的资源。决策快、投资快是创客100基金最显著的特点。

相关文章
谷歌推出AI视频对口型技术 模仿说话者声音、语气和面部表情

精彩评论