Všetko o deepfake hlasoch
Nárast deepfake médií je jednou z najhorúcejších tém v kybernetickej bezpečnosti a médiách. Má mnoho podôb – od obsahu pre dospelých cez falošné správy až po finančné podvody. Použitie podobizne či hlasu niekoho iného bez jeho súhlasu v dôveryhodne pôsobiacich videách a nahrávkach môže vyzerať ako prelom v umelej inteligencii, no prináša množstvo kontroverzií.
Čo je deepfake hlas?
Deepfake hlas je nahrávka, ktorá veľmi verne napodobňuje hlas reálneho človeka. Aj keď je syntetická, znie prirodzene a vie presne kopírovať tón, prízvuk, kadenciu aj ďalšie jedinečné črty reči.
Ľudia, ktorí vytvárajú deepfake hlasy či klonovanie hlasu, používajú AI technológie a výkonný hardvér. Niekedy trvá celé týždne naklonovať hlas inej osoby. Okrem špecializovaných nástrojov a softvéru potrebujú deepfaky aj tréningové dáta – často viacero nahrávok cieľovej osoby.
Tento proces sa čiastočne podobá používaniu textu na reč na generovanie syntetických hlasov. TTS softvér však väčšinou vytvára prirodzene znejúce hlasy bez snahy napodobniť konkrétneho človeka.
Ak si ľudia klonujú vlastný hlas pre audioknihy, dubbing či iný obsah, nie je na tom nič zlé. Klonovanie hlasu inej osoby bez súhlasu je však vážny problém.
Riziká deepfake hlasov
Hlasová autentifikácia bola dlho len sci-fi. Dnes už existuje – a nie je neomylná. Ako sa vyvíjal deepfake softvér, podvodníci ním dokázali napáchať čoraz väčšie škody.
V roku 2020 dostal bankár telefonát od osoby, ktorú považoval za riaditeľa spoločnosti. Hlas poznal, a preto bez problémov schválil prevod 35 miliónov dolárov. Netušil, že išlo o klonovaný hlas.
Forbes informoval o podobnom prípade rok predtým. Stal sa v britskej energetickej firme, ktorú oklamal deepfake hlas dôveryhodnej osoby.
Získať čisté nahrávky hlasov je dnes veľmi jednoduché – cez diktafóny, online rozhovory, tlačové konferencie a pod. Technológia záznamu hlasu sa tiež zlepšuje, takže dáta pre AI modely sú presnejšie a deepfake hlasy ešte uveriteľnejšie.
Kyberbezpečnostné nástroje stále nemajú spoľahlivý spôsob odhaľovania audio deepfakeov.
Najlepší softvér na deepfake hlasy
Speechify
Na rozdiel od ostatných nástrojov Speechify Voice Over nie je appka na klonovanie hlasu. Ale text na reč využíva AI na vytváranie syntetických médií a prirodzene znejúcich hlasov. Speechify Voice Over Studio obsahuje rozsiahlu knižnicu ľudských hlasov a dokáže vytvárať nové hlasy podľa rôznych parametrov.
Prevod textu na hlas pomáha čítať spolu s textom alebo tvoriť podcasty. Dokáže vytvoriť audio súbory zo zadaného či naskenovaného textu. Hodí sa na marketing, odchádzajúce správy, zákaznícku podporu a mnohé ďalšie účely.
Resemble
Resemble AI patrí medzi najsilnejší softvér na audio deepfake nahrávky. Na klonovanie hlasu nevyžaduje veľké množstvo vstupných dát.
V Resemble si môžete naklonovať vlastný hlas – ideálne na predpripravené reklamy, skriptované podcasty či iné spoty. Softvér podporuje viacero jazykov a ponúka nástroje na moduláciu hlasu, intonáciu a emócie.
Descript
Descript je nástroj na klonovanie hlasu s pokročilou editáciou. Vie pracovať s prepisom aj audio klipmi a vygenerovať realistický hlas pre presvedčivé deepfake videá.
Aj keď je Descript náročnejší na ovládanie, ponúka pokročilé prispôsobenie, nahrávanie obrazovky a multitrack editovanie. Vďaka nemu pripravíte ultra-realistický prejav v ľubovoľnom hlase.
ReSpeecher
Použitie strojového učenia na tvorbu AI hlasov podobných ľuďom je vzrušujúce aj biznisovo lákavé. ReSpeecher využilo Lucasfilm na vytvorenie hlasu Luka Skywalkera v The Mandalorian.
Ukazuje sa, že deepfake softvér zvládne viac než len krátke klipy na sociálne siete. ReSpeecher je žiadaný pre kvalitu syntetického hlasu a veľmi presné napodobenie ľudskej reči.
Real-Time Voice Cloning
Nie každý chce míňať stovky eur mesačne na ReSpeecher či čakať v poradovníku. Mnohí hľadajú lacnejšie alebo bezplatné riešenie. Real-Time Voice Cloning je open-source softvér dostupný na GitHub.
Nepracuje sa s ním najjednoduchšie, ale vie vytvárať hlasové nahrávky iných osôb aj z kratších zvukových stôp. V niektorých prípadoch môžu vzorky oklamať Alexu alebo poslúžiť na žartovné telefonáty.
iSpeech
iSpeech je ďalší bezplatný generátor hlasu zameraný na klonovanie. Ponúka pokročilé rozpoznávanie reči aj čítačku textu. Má množstvo funkcií a kolekciu hlasov celebrít.
Môžete vytvárať vlastné deepfake hlasy, nahrávať svoj hlas či robiť šablóny. Je to univerzálny nástroj, hoci nie tak presvedčivý ako iné v tomto zozname. Je však skvelý ako prvý krok do deepfake sveta.
Speechify – vytvárajte prirodzené ľudské hlasy
Speechify využíva deep learning na generovanie prirodzených hlasov, ktoré znejú ľudsky bez klonovania konkrétnej osoby. Hoci sú s deepfakemi spojené riziká, TTS softvér je vo väčšine prípadov užitočný.
Vyskúšajte Speechify Voice Over Studio na podcasty, čítanie náročnejších textov, učenie jazykov a mnoho ďalších použití.
FAQ
Je FakeYou zadarmo?
FakeYou je obmedzený, no bezplatný AI generátor hlasu. Ponúka knižnicu hlasov pripomínajúcich hlasy celebrít. Môže ho používať ktokoľvek, komu neprekáža pomalší prevod. Dá sa jednoducho spustiť v prehliadači.
Ako rozpoznať deepfake hlas?
Na spoľahlivé rozpoznanie deepfake hlasu je potrebný veľmi pokročilý softvér a hardvér, ktorý analyzuje rečové vzorce, šum a ďalšie detaily nahrávky.
Aký je rozdiel medzi deepfake hlasom a hlasovým syntetizátorom?
Deepfake hlasy často znamenajú klonované hlasy, zatiaľ čo syntetizátory generujú ľudsky znejúce hlasy najmä na komerčné použitie.

