Els 5 millors generadors de veu deepfake
Els deepfakes s’han convertit en una gran innovació tecnològica els últims anys. La majoria els coneix per l'intercanvi de cares: imatges i vídeos artificials que reprodueixen la fesomia d'una persona i la posen sobre una altra.
Darrerament, també s'han posat de moda les veus sintètiques que imiten veus humanes reals.
Tant en un cas com en l'altre, s'utilitzen per a molts usos útils o d'entreteniment. En aquest article ens centrarem en la clonació de veu i et presentarem algunes de les millors eines per a la síntesi de veu generada per IA i la tecnologia deepfake.
Com funciona la clonació de veu?
La clonació de veu, també coneguda com a veu deepfake o sintètica, crea veus clonades mitjançant IA i algoritmes d'aprenentatge automàtic. Ha estat possible gràcies a l'avenç de la intel·ligència artificial, sobretot el deep learning.
Per generar una veu clonada de qualitat, cal un ordinador potent amb bones targetes gràfiques o potència al núvol. Això accelera el procés. També necessites prou dades, és a dir, gravacions de la veu de la persona objectiu.
Si dones prou dades a la IA, pots crear veus autèntiques que diguin qualsevol text amb text a veu o qualsevol cosa que diguis fent servir tecnologia de veu a veu.
Ara la IA pot clonar una veu humana amb només una hora de gravació, però com més veu li donis, més fàcil serà per a la IA fer la seva feina.
Les 5 millors eines per a síntesi de veu deepfake i clonació
Fa anys que existeixen aplicacions de canvi de veu tant per a Android (Google Play) com per a iOS (App Store). Pots clonar la veu de qui vulguis només descarregant una app al mòbil.
Al principi, calia tenir coneixements tècnics per aconseguir bons deepfakes i moltes empreses t’ho feien a mida. Ara, però, hi ha eines perquè qualsevol pugui crear deepfakes. Aquí tens les 5 millors per fer veus realistes d'altres persones.
Resemble.ai

Resemble.ai és un excel·lent programari de text a veu i àudio deepfake si vols crear una veu personalitzada amb poques dades. Només necessita tres minuts per començar; però, com més aportis, millor serà la qualitat.
És fàcil d'utilitzar: puja una gravació de veu teva o d'algú altre o parla directament al mostrejador. Funciona amb molts idiomes, permet canviar l'entonació i afegir emoció a la veu final.
El servei és gratuït durant dos minuts; després, cal pagar. Amb subscripció mensual pots pujar fins a 100.000 caràcters mensuals.
Els desavantatges són que el servei està pensat per a empreses d'entreteniment, així que només hi ha un pla per a l'ús personal.
Respeecher

Respeecher és un programari deepfake nou que promet veus naturals. L’utilitzen productors de cinema i TV, desenvolupadors de videojocs, actors de veu, podcasts, audiollibres, publicitat i doblatge. En un futur, podria aplicar-se a la sanitat.
Amb Respeecher pots expressar qualsevol emoció, recuperar veus de persones difuntes i fins i tot recrear veus infantils. A més, pots gravar en diferents idiomes i adaptar l'accent a qualsevol regió.
Respeecher ofereix tres dies de prova gratuïta: converteix fins a 15 minuts amb més de 100 veus.
FakeYou

FakeYou és una eina de síntesi de veu que utilitza IA i tècniques d'aprenentatge profund com xarxes neuronals. FakeYou és sobretot un servei de text a veu, però et permet personalitzar la veu al teu gust o segons les teves necessitats.
Si vols una veu prefabricada, n'hi ha gairebé 3.000, incloent-hi personatges de DC. Gràcies a l'entrenament del model, el resultat és molt natural i realista. Pots fer servir FakeYou gratis sense registrar-te, però la web té tres plans de preu amb més funcions.
Real-Time Voice Cloning
Real-Time Voice Cloning és un projecte de codi obert allotjat a GitHub. Aquesta eina només necessita cinc segons d'àudio per clonar una veu.
No hi ha versió web, però és gratuït d’instal·lar i funciona a Windows i Linux. No obstant això, pot ser difícil d’utilitzar si no tens coneixements tècnics.
Descript

Descript s’utilitza sobretot per editar podcasts i vídeos socials, però també inclou una eina de clonació de veu anomenada Overdub. Calen almenys 30 minuts de gravació llegint un guió preparat per l'eina. Després, podràs escriure qualsevol text i la IA el llegirà i podràs editar-lo sense tornar a gravar.
També pots editar vídeos, fer edició d’àudio multipista, gravar la pantalla, crear clips, publicar i incrustar a qualsevol lloc i transcriure amb gran precisió i rapidesa.
Amb una hora de transcripció i projectes il·limitats al mes, tens un límit gratuït de 1.000 paraules per a la veu Overdub. Si vols més paraules o més funcions, pots contractar un dels dos plans de pagament de Descript.
Speechify—Eina de text a veu d’alta qualitat
Per crear veus personalitzades i realistes, prova un programari de text a veu com Speechify o l’eina Generador de Voice Over de Speechify.
Speechify és un dels millors serveis de text a veu per a Chrome, Mac, Android i iOS . Amb Speechify pots convertir qualsevol text en veu natural i crear doblatges per als teus vídeos.
A més, Speechify t’ajuda a llegir més ràpid i a superar dificultats lectores. Pots escoltar webs, documents de Word, PDF, correus i molt més, sempre que contingui text.
Pots provar Speechify avui mateix al web, a Chrome, Google Play o Apple Store i descarregar-la gratis.
Preguntes freqüents
Quin és el millor generador de veu amb IA?
Els millors generadors de veu amb IA són Speechify, Murf, Synthesys i Listnr.
Quin és el millor programari deepfake gratuït?
Molts programes deepfake et deixen provar funcions de franc. Els millors són FakeYou i Descript.
Quin és el millor generador de veu per a YouTube?
Hi ha molts generadors de veu amb IA aptes per a YouTube, però Speechify és el millor del mercat. Fa servir IA per crear veus naturals d’alta qualitat, convertir-les a àudio WAV i MP3 i fer excel·lents doblatges per a YouTube.
Quant costa un programari text a veu?
El preu del programari de text a veu varia segons l'empresa. Moltes eines TTS ofereixen proves gratuïtes perquè decideixis si val la pena.
Es poden fer deepfakes de veus?
Hi ha moltes eines i apps amb tecnologia deepfake. Pots transformar veu o text en una altra veu, si proporciones una mostra i deixes que l’IA generadora de veu l’analitzi. Segons quina utilitzis, la mostra i el temps d’anàlisi poden variar.

