Social Proof

Tudo Sobre Vozes Deepfake

Speechify é o leitor de áudio número 1 do mundo. Acelere sua leitura de livros, documentos, artigos, PDFs, e-mails - qualquer coisa que você lê.

Destaques em

forbes logocbs logotime magazine logonew york times logowall street logo
Ouça este artigo com o Speechify!
Speechify

Descubra o que é necessário para criar uma voz deepfake, os perigos de usá-la e como utilizar software de texto para fala como alternativa.

Tudo Sobre Vozes Deepfake

O surgimento da mídia deepfake é um dos tópicos mais quentes na esfera da cibersegurança e mídia. Tem várias utilizações, desde a criação de conteúdo adulto até fake news e fraudes financeiras. Usar a imagem e a voz de outra pessoa sem seu consentimento em vídeos e áudios convincentes pode parecer um avanço tecnológico em inteligência artificial. No entanto, não está isento de controvérsias.

O que é uma voz deepfake?

Uma voz deepfake é uma voz que imita de forma muito próxima a voz de uma pessoa real. Embora sintética, a voz é semelhante à humana e pode replicar com precisão tonalidade, sotaques, cadência e outras características únicas.

Pessoas que criam vozes deepfake ou clonagem de voz usam tecnologia de IA e poder computacional robusto. Às vezes, pode levar semanas para clonar a voz de outra pessoa. Além disso, além de ferramentas e softwares especializados, deepfakes precisam de dados de treinamento. Isso geralmente significa ter gravações suficientes da voz da pessoa alvo.

De certa forma, esse processo é semelhante ao uso de software de texto para fala para gerar vozes sintéticas. Mas o software TTS geralmente cria vozes com som natural sem tentar replicar a voz de uma pessoa específica.

Naturalmente, não há problema em pessoas clonarem suas próprias vozes para audiolivros, narrações e outros tipos de conteúdo. No entanto, criar vozes deepfake de outras pessoas sem seu consentimento é uma preocupação séria.

Os riscos das vozes deepfake

A autenticação por voz parecia algo saído de filmes de ficção científica por muito tempo. Infelizmente, a tecnologia existe hoje e está longe de ser infalível. À medida que o software de voz deepfake e as redes neurais evoluíram, golpistas foram capazes de causar mais danos.

Em 2020, um gerente de banco recebeu uma ligação de quem ele acreditava ser um diretor da empresa. O gerente reconheceu a voz e não teve problemas em autorizar uma transferência de 35 milhões de dólares. O gerente não tinha ideia de que a voz do diretor da empresa era uma voz clonada.

A Forbes relatou um incidente semelhante um ano antes. Aconteceu em uma empresa de energia do Reino Unido que foi enganada por uma voz deepfake de uma pessoa de confiança.

Ainda mais assustador, obter gravações claras das vozes das pessoas é fácil. Você pode obtê-las através de gravadores, entrevistas online, coletivas de imprensa, etc. A tecnologia de captura de voz também está melhorando muito. Assim, os dados alimentados nos modelos de IA são mais precisos e levam a vozes deepfake mais convincentes.

As ferramentas de cibersegurança ainda não desenvolveram maneiras infalíveis de detectar deepfakes de áudio.

O melhor software de voz deepfake

Speechify

Diferente de outras ferramentas nesta lista, Speechify Voice Over não é um aplicativo de clonagem de voz. No entanto, software de texto para fala usa algoritmos de IA de alta qualidade para criar mídia sintética e vozes com som natural. O Speechify Voice Over Studio vem com uma vasta biblioteca de vozes semelhantes a humanas e pode criar novas com base em vários parâmetros.

A conversão de voz a partir de texto ajuda as pessoas a acompanhar o texto escrito ou criar podcasts. Pode até fazer gravações de áudio com base no texto que você insere ou escaneia. Você pode usá-las para marketing, mensagens de saída, respostas de suporte ao cliente, etc.

Resemble

Resemble AI é um dos softwares de áudio mais poderosos para criar gravações deepfake. O software de clonagem não precisa de grandes quantidades de dados antes de começar a clonar.

Você pode usar o Resemble para clonar sua própria voz. Nesse cenário, é eficiente para criar clipes comerciais pré-gravados ou roteirizar podcasts, fazer anúncios, etc. O software de síntese de fala também suporta vários idiomas e oferece várias ferramentas de modulação para personalizar vozes e adicionar entonação ou emoção.

Descript

Descript é uma ferramenta de clonagem de voz com capacidades avançadas de edição. Pode trabalhar a partir de transcrições e clipes de áudio para gerar vozes realistas que as pessoas podem usar para vídeos deepfake convincentes.

Embora o Descript tenha uma curva de aprendizado alta, a personalização avançada, o gravador de tela e os recursos de edição multitrilha podem ajudá-lo a criar discursos ultra-realistas na voz de qualquer pessoa.

ReSpeecher

Usar algoritmos de aprendizado de máquina para criar vozes de IA que se assemelham a pessoas reais pode ser empolgante e um ótimo negócio. ReSpeecher é o software usado pela Lucasfilm para criar a voz de Luke Skywalker em The Mandalorian.

Isso mostra que alguns softwares de voz deepfake podem fazer mais do que clipes curtos para redes sociais. O ReSpeecher está em alta demanda devido à sua capacidade de síntese de fala de qualidade e histórico comprovado de imitar vozes humanas.

Clonagem de Voz em Tempo Real

Nem todo mundo tem centenas de dólares para gastar todo mês no ReSpeecher ou esperar na fila de usuários. Algumas pessoas querem uma opção mais acessível, talvez gratuita. A Clonagem de Voz em Tempo Real é um software de código aberto que qualquer pessoa pode acessar no GitHub.

Não é o software de síntese de fala mais fácil de trabalhar para gerar gravações de voz na voz de outra pessoa, mas funciona com clipes de áudio menores. Em alguns casos de uso, as amostras de áudio podem ser suficientes para enganar a Alexa ou fazer algumas chamadas de trote.

iSpeech

iSpeech é outro gerador de voz gratuito focado na clonagem de voz. Possui software avançado de reconhecimento de fala e um leitor de texto para fala. O aplicativo tem funcionalidade estendida e uma coleção existente de vozes de celebridades.

Você pode usar o iSpeech para criar deepfakes de voz personalizados e modelos únicos e gravar sua própria voz. É uma ferramenta versátil, embora não tão convincente quanto outras nesta lista. Ainda assim, serve como um ótimo aplicativo introdutório ao mundo dos deepfakes.

Speechify – Crie vozes humanas com som natural

Speechify aproveita ao máximo os algoritmos de aprendizado profundo para gerar vozes humanas com som natural que podem passar por humanas sem clonar a voz de uma pessoa específica. Embora os deepfakes tenham muitas preocupações de segurança cibernética, o software de texto para fala é geralmente mais útil do que prejudicial.

Experimente o Speechify Voice Over Studio para criar podcasts e narrações, ler conteúdos complexos com mais facilidade, aprender um novo idioma e muito mais.

FAQ

O FakeYou é gratuito?

FakeYou é um gerador de voz de IA limitado, mas gratuito. Possui uma extensa biblioteca de vozes que soam como celebridades, e qualquer pessoa pode usá-lo se não se importar com os tempos de conversão frequentemente lentos. Afinal, é fácil de usar em um navegador.

Como você pode detectar vozes deepfake?

Detectar vozes deepfake requer software e hardware altamente avançados para analisar padrões de fala, ruído de fundo e outros elementos.

Qual é a diferença entre uma voz deepfake e um sintetizador de voz?

Vozes deepfake geralmente se referem a vozes clonadas, enquanto sintetizadores de voz geram vozes humanizadas para fins comerciais.

Cliff Weitzman

Cliff Weitzman

Cliff Weitzman é um defensor da dislexia e o CEO e fundador da Speechify, o aplicativo de leitura em voz alta número 1 do mundo, com mais de 100.000 avaliações de 5 estrelas e ocupando o primeiro lugar na App Store na categoria Notícias e Revistas. Em 2017, Weitzman foi incluído na lista Forbes 30 Under 30 por seu trabalho em tornar a internet mais acessível para pessoas com dificuldades de aprendizagem. Cliff Weitzman já foi destaque em EdSurge, Inc., PC Mag, Entrepreneur, Mashable, entre outros meios de comunicação de destaque.