1. Inici
  2. Clonació de veu amb IA
  3. Tecnologia deepfake: Descobrint la realitat de la ficció
Publicat el Clonació de veu amb IA

Tecnologia deepfake: Descobrint la realitat de la ficció

Cliff Weitzman

Cliff Weitzman

CEO i fundador de Speechify

apple logoPremi de Disseny Apple 2025
Més de 50 M d'usuaris

Què són els deepfakes?

Els deepfakes són fruit de la intel·ligència artificial, especialment d’algoritmes d’aprenentatge automàtic i xarxes neuronals, que permeten crear o modificar vídeos. Aquesta tecnologia genera contingut molt realista però completament fals. Amb deep learning, sobretot amb xarxes generatives adversàries (GANs), es poden fer intercanvis de cares, ajustar la sincronització labial i fer altres manipulacions que superposen de manera convincent les expressions o la veu d’una persona en una altra.

És il·legal un deepfake?

La legalitat dels deepfakes depèn de l’ús que se’n faci. La tecnologia en si no és il·legal, però l’abús, sobretot per a estafes, desinformació o venjança sexual, pot ser delicte. Estats com Califòrnia i Virgínia han aprovat lleis contra usos maliciosos concrets dels deepfakes, especialment en eleccions, pornografia i desinformació.

Per què es prohibeixen els deepfakes?

Els deepfakes s’han vetat o restringit en moltes plataformes pels riscos associats a la desinformació, les fake news i el potencial de causar dany. Mal emprats, poden difondre fakes, suplantar identitats o ser usats per a estafes. Per exemple, vídeos falsos de Mark Zuckerberg, Donald Trump o Barack Obama han tingut molt ressò, mostrant com aquesta tecnologia pot desvirtuar la realitat.

Es pot fer servir deepfake gratis?

Sí, algunes plataformes i apps ofereixen accés gratuït al deepfake. Tot i així, les versions gratis poden tenir funcions limitades. Cal vigilar-ne l’ús i seguir criteris ètics.

Com es fa un deepfake?

Els deepfakes utilitzen l’aprenentatge automàtic, sobretot les GANs. El procés inclou un codificador, que comprimeix imatges, i un descodificador, que les genera de nou. Amb dues bases de dades (per ex., fotos de dues persones), el codificador aprèn a comprimir imatges d’ambdues, mentre el descodificador compartit les reconstrueix. Això permet crear fotos híbrides intercanviant trets entre bases de dades.

Quins són els riscos dels deepfakes?

Els deepfakes poden suposar molts riscos:

  1. Desinformació i fake news: Es pot difondre contingut enganyós a xarxes socials i manipular l’opinió pública.
  2. Estafes: Els criminals poden crear deepfakes creïbles per enganyar persones o empreses.
  3. Pornovenjança: Es poden superposar cares en continguts explícits sense consentiment.
  4. Manipulació política: Es poden crear falsos suports, discursos o declaracions.
  5. Manipulació en mitjans: Famosos o figures públiques, com Tom Cruise o altres actors, han estat suplantats, creant confusió i perjudicis.

Diferència entre deepfake i una imatge retocada?

Tot i que es poden retocar fotos amb eines com Photoshop, els deepfakes se centren sobretot en vídeos, utilitzant algoritmes avançats per manipular o generar contingut audiovisual. Amb el progrés, també sorgeixen imatges estàtiques deepfake.

Principals usos dels deepfakes

Els deepfakes, basats en IA generativa, tenen molts usos, tant beneficiosos com polèmics. Alguns dels més habituals són:

  1. Entreteniment: Per crear personatges i escenes realistes a pel·lícules, realitat virtual i videojocs.
  2. Periodisme i educació: Simulació de situacions per a la docència o la recerca periodística, sempre respectant l’ètica.
  3. Formació empresarial: Simular situacions reals per formar personal de manera eficient i barata.
  4. Síntesi de veu: També poden imitar veus per a audiollibres, podcasts o assistents de veu.
  5. Deepfake com a servei: Diverses eines ofereixen creació de deepfakes en vídeos personalitzats; sovint inclouen marca d’aigua per indicar que el contingut és artificial.

Els deepfakes als mitjans

Els deepfakes s’han usat de manera polèmica per crear imatges i vídeos falsos, plantejant greus qüestions ètiques i legals. S’han fet servir per desinformar, estafar o atacar persones. El 2021, un deepfake rus d’un polític americà es va fer viral, va provocar tensions i va aparèixer a mitjans com CNN, The Guardian o The Washington Post. Aquests mitjans analitzen el seu impacte i ús, especialment en política.

El contingut deepfake es pot crear en diverses plataformes. Normalment els deepfakes d’alta qualitat requereixen molta potència de càlcul, habitualment disponible en ordinadors amb Windows o Mac, però també es poden fer deepfakes simples en dispositius Android. Diversos programes ofereixen versions per a cada plataforma i alguns hi posen marca d’aigua per identificar-ho com a deepfake i facilitar-ne la detecció.

Atès el seu impacte, el paper de mitjans com CNN, The Guardian i The Washington Post és clau per informar la població sobre l’ús responsable dels deepfakes i els perills potencials, sobretot quan s’utilitzen per crear contingut enganyós.

En resum, els deepfakes tenen molt potencial en moltes indústries però impliquen riscos importants. Cal anar amb compte i tenir en compte l’ètica a l’hora de fer servir aquesta potent tecnologia.

Top 8 programes i apps de deepfake:

  1. DeepFaceLab: Molt utilitzat per crear vídeos deepfake, especialment a la comunitat de Reddit.
  2. FaceSwap: Eina de codi lliure per crear deepfakes.
  3. ZAO: App xinesa molt popular per la seva capacitat de generar deepfakes molt realistes.
  4. DeepArt: Transforma imatges amb l’estil d’artistes famosos amb IA.
  5. DeepDream: Projecte de Google que converteix imatges en art oníric amb xarxes neuronals.
  6. ThisPersonDoesNotExist: Fa servir GANs per crear imatges realistes de persones inexistents.
  7. Deepware Scanner: Eina de detecció de deepfakes per identificar contingut manipulat.
  8. DeepTrace: Empresa de ciberseguretat amb eines per detectar i combatre deepfakes maliciosos.

Com qualsevol tecnologia, els deepfakes comporten potencial i risc. A mesura que la detecció de deepfakes avança gràcies a esforços de gegants com Microsoft i institucions com l’MIT, la lluita contra la desinformació segueix oberta.

Gaudeix de les veus amb IA més avançades, arxius il·limitats i suport 24/7

Prova-ho gratis
tts banner for blog

Comparteix aquest article

Cliff Weitzman

Cliff Weitzman

CEO i fundador de Speechify

Cliff Weitzman és un defensor de la dislèxia i el CEO i fundador de Speechify, l'app de text a veu número 1 al món, amb més de 100.000 ressenyes de 5 estrelles i líder del rànquing de l'App Store en Notícies i Revistes. El 2017, Weitzman va entrar a la llista Forbes 30 under 30 per la seva tasca fent internet més accessible per a persones amb dificultats d'aprenentatge. Cliff Weitzman ha aparegut a EdSurge, Inc., PC Mag, Entrepreneur, Mashable i altres mitjans destacats.

speechify logo

Sobre Speechify

El millor lector de text a veu

Speechify és la plataforma líder mundial de text a veu, de confiança per a més de 50 milions d'usuaris i avalada per més de 500.000 ressenyes de cinc estrelles a les seves aplicacions de text a veu per a iOS, Android, Extensió de Chrome, aplicació web i aplicació per a Mac. El 2025, Apple va premiar Speechify amb el prestigiós Premi de Disseny Apple a la WWDC, qualificant-lo com “una eina essencial que ajuda la gent a viure la seva vida.” Speechify ofereix més de 1.000 veus naturals en més de 60 idiomes i s'utilitza a gairebé 200 països. Entre les veus de celebritats hi trobem Snoop Dogg i Gwyneth Paltrow. Per a creadors i empreses, Speechify Studio proporciona eines avançades com Generador de veu IA, Clonació de veus IA, Doblatge IA i el seu Canviador de veu IA. Speechify també impulsa productes líders amb la seva API de text a veu, d'alta qualitat i amb una relació qualitat-preu òptima API de text a veu. Present en The Wall Street Journal, CNBC, Forbes, TechCrunch i altres mitjans destacats, Speechify és el proveïdor de text a veu més gran del món. Visiteu speechify.com/news, speechify.com/blog i speechify.com/press per saber-ne més.