精选推荐
了解创建深度伪造声音所需的条件、使用它的风险,以及如何使用文本转语音软件作为替代方案。
关于深度伪造声音的一切
深度伪造媒体的兴起是网络安全领域和媒体中最热门的话题之一。它有多种用途,从制作成人内容到假新闻再到金融欺诈。未经他人同意使用其肖像和声音制作可信的视频和音频片段,似乎是人工智能技术的突破。然而,这并非没有争议。
什么是深度伪造声音?
深度伪造声音是一种能够逼真模仿真实人声的声音。虽然是合成的,但这种声音听起来像人声,可以准确复制语调、口音、节奏和其他独特特征。
创建深度伪造声音或声音克隆的人使用人工智能技术和强大的计算能力。有时克隆另一个人的声音可能需要数周时间。此外,除了专业工具和软件,深度伪造还需要训练数据。这通常意味着需要有足够的目标人物声音录音。
在某些方面,这个过程类似于使用文本转语音软件生成合成声音。但TTS软件通常会创建自然听起来的声音,而不是试图复制特定人的声音。
当然,人们为有声书、配音和其他类型的内容克隆自己的声音并没有错。然而,未经他人同意创建他们的深度伪造声音是一个严重的问题。
深度伪造声音的风险
语音认证曾经像是科幻电影中的情节。不幸的是,如今这项技术已经存在,并且远非无懈可击。随着深度伪造语音软件和神经网络的发展,诈骗者能够造成更大的损害。
早在2020年,一位银行经理接到一个他认为是公司董事的电话。经理认出了声音,毫不犹豫地授权转账3500万美元。经理完全不知道公司董事的声音是克隆的。
《福布斯》报道了前一年发生的类似事件。事件发生在一家英国的能源公司,该公司被一个可信任的个人的深度伪造声音所骗。
更可怕的是,获取清晰的人声录音非常容易。你可以通过录音设备、在线采访、新闻发布会等方式获得。语音捕捉技术也在不断进步。因此,输入到人工智能模型中的数据更加准确,导致更可信的深度伪造声音。
网络安全工具尚未找到检测音频深度伪造的万无一失的方法。
最佳深度伪造声音软件
Speechify
与此列表中的其他工具不同,Speechify Voice Over不是一个声音克隆应用程序。然而,文本转语音软件使用高质量的AI算法来创建合成媒体和自然听起来的声音。Speechify Voice Over Studio拥有庞大的人声库,并可以根据各种参数创建新的声音。
从文本转换为语音有助于人们跟随书面文本阅读或创建播客。它甚至可以根据您输入或扫描的文本制作音频录音。您可以将它们用于营销、外发消息、客户支持回复等。
Resemble
Resemble AI是创建深度伪造录音的最强大音频软件之一。克隆软件在开始克隆之前不需要大量数据。
您可以使用Resemble克隆自己的声音。在这种情况下,它在创建预录制的商业片段或脚本播客、制作广告等方面非常高效。语音合成软件还支持多种语言,并提供各种调制工具以个性化声音并添加语调或情感。
Descript
Descript是一个声音克隆工具,具有高级编辑功能。它可以从转录和音频片段中生成逼真的声音,人们可以用来制作令人信服的深度伪造视频。
虽然Descript的学习曲线较高,但其高级定制、屏幕录制和多轨编辑功能可以帮助您用任何人的声音创建超逼真的演讲。
ReSpeecher
使用机器学习算法创建类似真人的AI声音,这不仅令人兴奋,也是一个很好的商业机会。ReSpeecher是卢卡斯影业用于在《曼达洛人》中创造卢克·天行者声音的软件。
这表明一些深度伪造语音软件不仅限于社交媒体的短片。由于其高质量的合成语音能力和模仿人声的成功记录,ReSpeecher需求量很大。
实时语音克隆
并不是每个人都有数百美元每月花在ReSpeecher上,或者愿意在用户队列中等待。有些人希望有一个更实惠,甚至免费的选择。实时语音克隆是一个开源软件,任何人都可以在GitHub上访问。
虽然它不是最容易使用的语音合成软件来生成他人声音的录音,但它可以处理较小的音频片段。在某些使用场景中,这些音频样本足以欺骗Alexa或进行一些恶作剧电话。
iSpeech
iSpeech是另一个专注于语音克隆的免费语音生成器。它具有先进的语音识别软件和文本转语音阅读器。该应用程序功能扩展,并拥有现成的名人声音库。
您可以使用iSpeech创建自定义语音深度伪造和独特模板,并录制自己的声音。虽然它不如此列表中的其他工具逼真,但它是进入深度伪造世界的一个很好的入门应用。
Speechify – 创建自然的人声
Speechify充分利用深度学习算法生成自然的人声,可以在人类声音中传达而不克隆特定人的声音。尽管深度伪造存在许多网络安全问题,但文本转语音软件通常比帮助更有用。
试用Speechify语音工作室 来创建播客和旁白,更轻松地阅读复杂内容,学习新语言,等等。
常见问题
FakeYou是免费的吗?
FakeYou是一个有限但免费的AI语音生成器。它拥有一个庞大的名人声音库,任何人都可以使用,只要他们不介意通常较慢的转换时间。毕竟,它在浏览器中很容易使用。
如何检测深度伪造语音?
检测深度伪造语音需要高度先进的软件和硬件来分解语音模式、背景噪音和其他元素。
深度伪造语音和语音合成器有什么区别?
深度伪造语音通常指克隆的声音,而语音合成器则用于商业目的生成类似人类的声音。
Cliff Weitzman
Cliff Weitzman 是一位阅读障碍倡导者,也是全球排名第一的文字转语音应用Speechify的首席执行官和创始人,该应用在App Store新闻与杂志类中排名第一,拥有超过10万个五星好评。2017年,Weitzman因其在提高学习障碍人士网络可访问性方面的贡献,被评为福布斯30位30岁以下精英之一。Cliff Weitzman曾被EdSurge、Inc.、PC Mag、Entrepreneur、Mashable等知名媒体报道。