Social Proof

Hvordan klone stemmer

Speechify er den beste AI Voice Over Generatoren. Lag menneskelignende voice over-opptak i sanntid. Fortell tekst, videoer, forklaringer – hva som helst – i enhver stil.

Leter du etter vår Tekst-til-tale-leser?

Fremhevet i

forbes logocbs logotime magazine logonew york times logowall street logo
Lytt til denne artikkelen med Speechify!
Speechify

Stemme-kloning har potensial til å revolusjonere vår tilnærming til utdanning, næringsliv og fritid. Slik kan du også gjøre det.

I motsetning til faktisk kloning, er stemme-kloning trygt, enkelt å lære seg, og tilgjengelig for stort sett alle med en internettforbindelse. Dessuten er det ikke bare praktisk, men også nyttig, og revolusjonerer måten vi nærmer oss utdanning, næringsliv, videospill, litteratur og alt annet under solen. Vil du prøve? Bli med videre!

Hva er stemme-kloning?

Stemme-kloning er akkurat det du forestiller deg — å replikere og generere en persons stemme ved hjelp av kunstig intelligens (AI). Det kan høres ut som noe fra en sci-fi-film, men vi er sikre på at du allerede har hatt litt erfaring med det. Husker du det tekst-til-tale (TTS) programmet du lekte med, som leste nyheter for deg med Arnold Schwarzeneggers stemme? Det er et eksempel på stemme-kloning. Enkle TTS-nettleserutvidelser og apper er ikke like sofistikerte og kraftige når det gjelder stemme-kloning. Selvfølgelig skal de ikke være det, siden det ikke er deres hovedmål. Riktige stemme-kloningsløsninger går mye dypere i sine tale-mønsteranalyser, noe som lar dem fokusere på å identifisere og utnytte alle detaljene som gjør en stemme unik. Som du kan gjette, betyr mer omfattende tilbakemelding mer autentiske AI-stemmer og mer avansert maskinlæring.

Bruksområder for stemme-kloning

Stemme-kloning er mer enn bare en gimmick og har mange bruksområder innen utdanning, næringsliv, medisin, osv. Selvfølgelig, som med bokstavelig kloning, er det noen etiske spørsmål som vil dukke opp (bare tenk på de deepfakes som har lekket). Men vi lar de filosofiske debattene ligge til en annen dag og prøver å se på den lyse siden.

Utdanning

Utdanning har, sakte men sikkert, beveget seg over til den digitale verden. Vi er ikke her for å diskutere hvilke konsekvenser det kan ha for utdanningssystemet, men heller for å påpeke et enkelt faktum — skjermer og Zoom-samtaler erstatter klasserom og tavler. Det betyr at vi har mange ressurser til rådighet som vi kan bruke for å gjøre forelesningene våre mer engasjerende og underholdende. Med stemme-kloning, for eksempel, kan vi bruke dyp læring for å replikere stemmene til historiske figurer. Tenk deg å høre Nikola Tesla forklare vekselstrøm til deg.

Lydbøker

Neste på listen er lydbøker. Selv om vi tenker på dem som pedagogiske verktøy og en måte å slappe av på, er lydbøker mye viktigere enn det. For noen mennesker er de den eneste måten å interagere med det skrevne ordet på, spesielt for synshemmede. Med stemme-kloningsteknologi kan vi forvandle lydbøker til noe mye mer underholdende og engasjerende.

Tekst-til-tale tjenester

Før vi ser hvordan sanntids stemme-kloning og talesyntese fungerer, la oss gå tilbake til TTS-programmer et øyeblikk og se hvor godt de kan gjøre jobben. For eksempel, la oss ta en titt på Speechify, en av de mest sofistikerte TTS-løsningene som er tilgjengelige. Hva kan Speechify gjøre?  Speechify kan gjøre hvilken som helst tekst om til lydfiler, den kan skanne fysiske dokumenter og konvertere dem til tale, og den kan hjelpe deg med å lage voiceovers for bloggen din, osv. Hvorfor nevner vi alt dette? Fordi TTS-apper er rimelige og tilgjengelige, kan de ikke bare dra nytte av stemme-kloning mye, men også hjelpe med å skyve stemme-kloning fremover inn i mainstream. For eksempel har Speechify kjendisstemmer, så du kan høre din favorittroman lest av Gwyneth Paltrow. Prøv det ut.

Hvordan lages AI-stemmer?

Nå kan vi gå tilbake til det nerdete og fortelle deg hvordan AI-stemmer faktisk lages og hvordan de klarer å høres ut som menneskestemmer. Ikke bekymre deg — vi skal ikke gjøre det for komplisert. Som vi allerede har sagt, bruker stemme-kloning AI-teknologi dyp læring for å finne ut hva det er som gjør en stemme til ens egen stemme. Vi snakker om tonehøyde, tone, aksent, lydstyrke, og alt annet vi forbinder med en persons stemme. Som du kan forestille deg, krever det kraftig teknologi for å finne ut alt dette; men det er mulig. Det som faktisk er viktig, er at vi mater det dype nevrale nettverket med mye lydinput. På en måte er det også slik vi lærer fremmedspråk! Selvfølgelig har teknologien utviklet seg nå, og noen løsninger tar bare noen få timer for å spikre den ønskede stemmen, noe som er fantastisk hvis det ikke er nok lyddata vi kan bruke (husk hva vi sa om historiske figurer).

Stemme-kloningsapper

Som du kan forestille deg, finnes det mange stemme-kloningsapper der ute nå som internett er allestedsnærværende. Selvfølgelig gjør noen en bedre jobb enn andre. Her er noen av våre toppvalg som du kan bruke for å lage dine egne syntetiske stemmer og utnytte den fulle kraften av talesyntese fra komforten av ditt hjem:

  • Respeecher
  • Murf
  • Resemble
  • Descript

Stemme-kloningsnettsteder

Hvis du er kjent med TTS-verktøy, vet du at du ikke alltid trenger å laste ned apper for å få jobben gjort. I stedet kan du bruke nettleserutvidelser og nettsteder for en raskere løsning. Det samme gjelder for AI-stemme-kloning. Du kan for eksempel bruke noe som Zzlab. Men hvis du vil utnytte syntetiske taleprogrammer best mulig, foreslår vi å laste ned Speechify eller noen av programmene vi nevnte ovenfor.

FAQ

Hva er forskjellen mellom stemmekloning og stemmeforvrengning?

Svaret er enkelt: stemmeforvrengning handler om å endre en stemme for å få den til å høres annerledes ut, altså å sette den gjennom et digitalt filter. Stemmekloning, derimot, er en mer kompleks prosess som involverer dyp- og maskinlæring med mål om å skape en AI-stemme som kan produsere lyd på egen hånd og ikke bare endre talerens stemme i sanntid.

Hvem er den enkleste personen å klone?

Den enkleste stemmemodellen å klone ville være den med mest stemmedata og lydprøver tilgjengelig. For eksempel kan du bruke dine egne stemmeopptak eller se etter stemmene til populære innholdsskapere og kjendiser fordi algoritmene allerede favoriserer dem.

Cliff Weitzman

Cliff Weitzman

Cliff Weitzman er en forkjemper for dysleksi og administrerende direktør og grunnlegger av Speechify, verdens ledende app for tekst-til-tale, med over 100 000 femstjerners anmeldelser og førsteplass i App Store i kategorien Nyheter og Magasiner. I 2017 ble Weitzman kåret til Forbes 30 under 30-listen for sitt arbeid med å gjøre internett mer tilgjengelig for personer med lærevansker. Cliff Weitzman har blitt omtalt i EdSurge, Inc., PC Mag, Entrepreneur, Mashable, blant andre ledende medier.