Download now

Voz de Deepfake

Table of Contents

La voz deepfake

La moda del deepfake es uno de los temas más candentes en la esfera de la ciberseguridad y los medios de comunicación. Tiene diversos usos, desde la creación de contenidos para adultos a noticias falsas o fraudes financieros. Utilizar la imagen y la voz de otra persona sin su consentimiento en clips de vídeo y audio creíbles puede parecer un avance tecnológico en inteligencia artificial. Sin embargo, no está exento de polémica.

 

¿Qué es una deepfake voice?

Una deepfake voice es una voz que imita fielmente la de una persona real. Aunque sintética, la voz se asemeja a la humana y puede reproducir con precisión la tonalidad, los acentos, la cadencia y otras características únicas.

 

Los creadores de voces falsas o de clonación de voces utilizan tecnología de inteligencia artificial y una gran capacidad informática. A veces, clonar la voz de otra persona puede llevar semanas. Además, aparte de herramientas y software especializados, los deepfakes necesitan datos de entrenamiento. Eso suele significar disponer de suficientes grabaciones de la voz de la persona objetivo.

 

En cierto modo, este proceso es similar al uso de software de conversión de texto a voz para generar voces sintéticas. Pero el software TTS suele crear voces que suenan naturales sin intentar replicar la voz de una persona concreta.

 

Naturalmente, no hay nada malo en que la gente clone sus voces para audiolibros, locuciones y otros tipos de contenido. Sin embargo, crear voces deepfake de otras personas sin su consentimiento es un grave problema.

 

Los riesgos de las voces deepfake

Durante mucho tiempo, la autenticación de voz parecía algo sacado de las películas de ciencia ficción. Por desgracia, la tecnología existe hoy en día y dista mucho de ser infalible. A medida que el software de voz deepfake y las redes neuronales evolucionaban, los estafadores eran capaces de hacer más daño.

 

En 2020, el director de un banco recibió una llamada de quien creía que era el director de una empresa. El director reconoció la voz y no tuvo problemas para autorizar una transferencia de 35 millones de dólares. El gerente no tenía ni idea de que la voz del director de la empresa era una voz clonada.

 

Forbes informó de un incidente similar un año antes. Ocurrió en una empresa energética del Reino Unido que fue estafada por una voz falsa de una persona de confianza.

 

Y lo que es aún más aterrador, obtener grabaciones claras de la voz de las personas no supone ningún esfuerzo. Se pueden conseguir a través de grabadoras, entrevistas online, ruedas de prensa, etc. La tecnología de captura de voz también está mejorando mucho. Así, los datos que se introducen en los modelos de IA son más precisos y dan lugar a voces deepfake más creíbles.

 

Las herramientas de ciberseguridad aún no han ideado métodos infalibles para detectar las voces falsas.

 

Los mejores programas de deepfake de voz

Resemble

Resemble AI es uno de los programas de audio más potentes para crear grabaciones deepfake. El software de clonación no necesita grandes cantidades de datos antes de empezar a clonar.

 

Puedes utilizar Resemble para clonar tu propia voz. En ese caso, resulta eficaz para crear clips comerciales pregrabados o guiones para podcasts, hacer anuncios, etc. El software de síntesis de voz también es compatible con varios idiomas y ofrece diversas herramientas de modulación para personalizar las voces y añadir entonación y emoción.

 

Descript

Descript es una herramienta de clonación de voz con funciones de edición avanzadas. Puede trabajar a partir de transcripciones y clips de audio para generar voces realistas que la gente puede utilizar para vídeos deepfake convincentes.

 

Aunque Descript tiene una curva de aprendizaje elevada, las funciones avanzadas de personalización, grabador de pantalla y edición multipista pueden ayudarte a crear discursos ultrarrealistas con la voz de cualquier persona.

 

ReSpeecher

Utilizar algoritmos de aprendizaje automático para crear voces de IA que se parezcan a las de personas reales puede ser emocionante y un gran negocio. ReSpeecher es el software utilizado por Lucasfilm para crear la voz de Luke Skywalker en Mandalorian.

 

Demuestra que algunos programas de imitación de voz pueden hacer algo más que clips cortos para las redes sociales. ReSpeecher está muy solicitado debido a su capacidad de sintetizar voz de calidad y a su probado historial de imitación de voces humanas.

 

Clonación de voz en tiempo real

No todo el mundo tiene cientos de dólares para gastar cada mes en ReSpeecher o esperar en la cola de usuarios. Algunas personas quieren una opción más asequible, quizá gratuita. Real-Time Voice Cloning es un software de código abierto al que cualquiera puede acceder en GitHub.

 

No es el software de síntesis de voz más sencillo para generar grabaciones y locuciones con la voz de otra persona, pero funciona con clips de audio más pequeños. En algunos casos de uso, las muestras de audio podrían ser suficientes para engañar a Alexa o hacer algunas bromas telefónicas.

 

iSpeech

iSpeech es otro generador de voz gratuito centrado en la clonación de voz. Cuenta con un avanzado software de reconocimiento de voz y un lector de texto a voz. La app cuenta con funciones ampliadas y una colección existente de voces de famosos.

 

Puedes utilizar iSpeech para crear deepfakes de voz personalizados y plantillas únicas y grabar tu voz. Es una herramienta versátil, aunque no tan convincente como otras de esta lista. Sin embargo, sirve como una gran aplicación introductoria en el mundo de los deepfakes.

 

Speechify

A diferencia de otras herramientas de esta lista, Speechify no es una aplicación de clonación de voz. Sin embargo, el software de conversión de texto a voz utiliza algoritmos de IA de alta calidad para crear medios sintéticos y voces que suenen naturales. Speechify viene con una amplia biblioteca de voces similares a las humanas y puede crear otras nuevas en función de varios parámetros.

 

La conversión de voz a partir de texto ayuda a leer textos escritos o a crear podcasts. Incluso puede hacer grabaciones de audio basadas en el texto que introduzcas o escanees. Puedes utilizarlas para marketing, mensajes salientes, respuestas de atención al cliente, etc.

 

Speechify – Crea voces humanas que suenan naturales

Speechify aprovecha al máximo los algoritmos de aprendizaje profundo para generar voces humanas de sonido natural que pueden pasar por humanas sin clonar la voz de una persona específica. Aunque los deepfakes plantean muchos problemas de ciberseguridad, el software de conversión de texto a voz suele ser útil.

 

Prueba Speechify para crear podcasts y narraciones, leer contenidos complejos más fácilmente, aprender un nuevo idioma y mucho más.

 

PREGUNTAS FRECUENTES

¿Es FakeYou gratuito?

FakeYou es un generador de voz de IA limitado pero gratuito. Cuenta con una amplia biblioteca de voces que suenan como las de los famosos, y cualquiera puede utilizarlo si no le importan los tiempos de conversión, a menudo lentos. Después de todo, es fácil de usar en un navegador.

 

¿Cómo se detectan las voces deepfake?

La detección de voces deepfake requiere un software y un hardware muy avanzados para descomponer los patrones del habla, el ruido de fondo y otros elementos.

 

¿Cuál es la diferencia entre una voz falsa y un sintetizador de voz?

Las voces falsas suelen referirse a voces clonadas, mientras que los sintetizadores de voz generan voces similares a las humanas con fines comerciales.

Take the dyslexia quiz and get an instant score. See if you are dyslexic or not.

Listen and share everything on the go with our Soundbites. Try it for yourself.