2月18日听一个人工智能配音演员试着和你调情

导读近年来,人工智能生成的语音质量迅速提高,但人类语音的某些方面仍然无法合成模仿。当然,人工智能演员可以为演示和广告提供流畅的企业配音

近年来,人工智能生成的语音质量迅速提高,但人类语音的某些方面仍然无法合成模仿。当然,人工智能演员可以为演示和广告提供流畅的企业配音,但更复杂的表演——例如令人信​​服的哈姆雷特再现——仍然遥不可及。

人工智能语音初创公司Sonantic表示,它在音频深度伪造的开发方面取得了微小的突破,创造了一种可以表达诸如戏弄和调情等微妙细节的合成语音。该公司表示,其进步的关键是将非语音声音融入其音频中。训练它的AI模型来重现那些微小的呼吸——微小的嘲笑和半隐藏的笑声——这些让真实的语音具有生物真实性的印记。

“我们选择爱作为总主题,”Sonantic联合创始人兼首席技术官约翰弗林告诉TheVerge。“但我们的研究目标是看看我们是否可以模拟微妙的情绪。更大的情绪更容易捕捉。”

在下面的视频中,您可以听到该公司对调情AI的尝试——尽管您是否认为它捕捉到了人类语言的细微差别是一个主观问题。第一次听时,我认为这个声音与真人的声音几乎没有区别,但TheVerge的同事说他们立即将它作为机器人计时,指向某些单词之间留下的不可思议的空间,以及轻微的合成皱纹发音。

Sonantic首席执行官ZeenaQureshi将该公司的软件描述为“用于语音的Photoshop”。它的界面让用户可以输入他们想要合成的语音,指定传递的情绪,然后从一组AI声音中进行选择,其中大部分是从真人演员那里复制而来的。这绝不是一个独特的产品(像Descript这样的竞争对手销售类似的软件包),但Sonantic表示其定制水平比竞争对手的更深入。

传递的情感选择包括愤怒、恐惧、悲伤、幸福和快乐,并且在本周的更新中,调情、腼腆、戏弄和吹嘘。“导演模式”允许进行更多调整:可以调整声音的音高,调高或调低传递的强度,以及插入那些小的非语音发声,如笑声和呼吸声。

“我认为这是主要的区别——我们指挥、控制、编辑和塑造表演的能力,”弗林说。“我们的客户主要是AAA级游戏工作室、娱乐工作室,我们正在向其他行业扩张。今年早些时候,我们最近与梅赛德斯(定制其车载数字助理)建立了合作伙伴关系。”

然而,与此类技术的常见情况一样,Sonantic成就的真正基准是从其机器学习模型中新鲜出炉的音频,而不是在经过打磨的PR就绪演示中使用的音频。Flynn表示,为其性感视频合成的语音“几乎不需要手动调整”,但该公司确实循环了几个不同的渲染以找到最佳输出。

为了尝试获得Sonantic技术的原始且具有代表性的样本,我要求他们使用几种不同的情绪渲染同一行(针对您,亲爱的Verge读者)。你可以自己听听比较。

首先,这里是“轻浮”:

然后“戏弄”:

“高兴”:

“快乐”:

最后,“休闲”:

至少在我看来,这些剪辑比演示要粗糙得多。这表明了一些事情。首先,需要人工打磨才能充分利用AI声音。许多人工智能的努力都是如此,比如自动驾驶汽车,它已经成功地实现了非常基本的驾驶自动化,但仍然在与定义人类能力的最后也是最重要的5%做斗争。这意味着全自动、完全令人信服的人工智能语音合成还有一段路要走。

其次,我认为这表明启动的心理概念可以在很大程度上欺骗你的感官。视频演示-其镜头中真实的人类演员与镜头非常亲密-可能会提示您的大脑听到伴随的声音是真实的。那么,最好的合成媒体可能是结合了真实和虚假输出的媒体。

除了该技术的说服力如何之外,Sonantic的演示还引发了其他问题——比如,部署调情人工智能的道德规范是什么?以这种方式操纵听众是否公平?为什么Sonantic选择将其调情的人物塑造为女性?(这种选择可以说在男性主导的科技行业延续了一种微妙的性别歧视形式,公司倾向于将人工智能助理编码为顺从——甚至是轻浮的——秘书。)

在第一个问题上,该公司表示他们选择女性声音的灵感来自于SpikeJonze2013年的电影Her,主角爱上了一位名叫Samantha的女性AI助手。其次,Sonantic表示,它认识到伴随新技术发展而来的道德困境,并且在如何以及在何处使用其AI声音时非常谨慎。

“这是我们坚持娱乐的最大原因之一,”首席执行官Qureshi说。“CGI不只是用于任何事情——它用于最好的娱乐产品和模拟。我们以同样的方式看待这种[技术]。”她补充说,该公司的所有演示都披露了该声音确实是合成的(尽管如果客户想使用该公司的软件为更多欺骗目的生成声音,这并不意味着什么)。

将AI语音合成与其他娱乐产品进行比较是有道理的。毕竟,被电影和电视操纵可以说是我们最初制作这些东西的原因。但还有一点要说的是,人工智能将允许大规模部署此类操作,而较少关注其在个别情况下的影响。例如,在世界各地,人们已经开始与人工智能聊天机器人建立关系——甚至坠入爱河。将AI生成的声音添加到这些机器人中肯定会使它们更强大,从而引发有关如何设计这些和其他系统的问题。如果AI声音可以令人信服地调情,它们会说服你做什么?

免责声明:本文由用户上传,如有侵权请联系删除!