Sådan laver du stemmekloning
Leder du efter vores Tekst til Tale Læser?
Fremhævet i
Stemmekloning har potentiale til at revolutionere vores tilgang til uddannelse, erhvervsliv og fritid. Her er hvordan du også kan gøre det.
I modsætning til faktisk kloning, er stemmekloning sikker, nem at lære og tilgængelig for stort set alle med en internetforbindelse. Desuden er det ikke kun praktisk, men også nyttigt, og revolutionerer måden vi tilgår uddannelse, erhvervsliv, videospil, litteratur og alt andet under solen. Vil du prøve det? Bliv hængende!
Hvad er stemmekloning?
Stemmekloning er præcis, hvad du forestiller dig — at replikere og generere en persons stemme via kunstig intelligens (AI). Det lyder måske som noget fra en sci-fi film, men vi er sikre på, at du allerede har haft lidt erfaring med det. Kan du huske det tekst-til-tale (TTS) program, du brugte til at få læst nyheder op i Arnold Schwarzeneggers stemme? Det er et eksempel på stemmekloning. Enkle TTS-browserudvidelser og apps er ikke så sofistikerede og kraftfulde, når det kommer til stemmekloning. Selvfølgelig behøver de ikke være det, da det ikke er deres hovedmål. Rigtige stemmekloningsløsninger går meget dybere i deres taleanalyse, hvilket gør det muligt for dem at fokusere på at udnytte alle de detaljer, der gør en stemme unik. Som du kan gætte, betyder mere omfattende feedback mere autentiske AI-stemmer og mere avanceret maskinlæring.
Anvendelser af stemmekloning
Stemmekloning er mere end bare en gimmick og har mange anvendelser inden for uddannelse, erhvervsliv, medicin osv. Selvfølgelig, ligesom med bogstavelig kloning, er der nogle etiske spørgsmål, der vil dukke op (tænk bare på de deepfakes, der er blevet lækket). Men vi vil lade de filosofiske debatter ligge til en anden dag og prøve at se på den lyse side.
Uddannelse
Uddannelse er langsomt men sikkert ved at bevæge sig over i den digitale verden. Vi er ikke her for at diskutere, hvilke konsekvenser det kan have for uddannelsessystemet, men snarere for at påpege en simpel kendsgerning — skærme og Zoom-opkald erstatter klasseværelser og tavler. Det betyder, at vi har masser af ressourcer til rådighed, som vi kan bruge til at gøre vores forelæsninger mere engagerende og underholdende. Med stemmekloning kan vi for eksempel bruge dyb læring til at replikere stemmerne fra historiske figurer. Forestil dig at lytte til Nikola Tesla forklare vekselstrøm for dig.
Lydbøger
Næste punkt er lydbøger. Selvom vi tænker på dem som uddannelsesværktøjer og en måde at slappe af på, er lydbøger meget vigtigere end det. For nogle mennesker er de den eneste måde at interagere med det skrevne ord på, især for synshandicappede. Med stemmekloningsteknologi kan vi forvandle lydbøger til noget langt mere underholdende og engagerende.
Tekst-til-tale tjenester
Før vi ser, hvordan realtids stemmekloning og talesyntese fungerer, lad os vende tilbage til TTS-programmer et øjeblik og se, hvor godt de kan klare opgaven. For eksempel, lad os tage et kig på Speechify, en af de mest sofistikerede TTS-løsninger tilgængelige. Hvad kan Speechify gøre? Speechify kan omdanne enhver tekst til lydfiler, det kan scanne fysiske dokumenter og konvertere dem til tale, og det kan hjælpe dig med at lave voiceovers til din blog osv. Hvorfor nævner vi alt det? Fordi TTS-apps er overkommelige og tilgængelige, kan de ikke kun drage stor fordel af stemmekloning, men også hjælpe med at skubbe stemmekloning frem i mainstream. For eksempel har Speechify kendisstemmer, så du kan lytte til din yndlingsroman læst op af Gwyneth Paltrow. Prøv det.
Hvordan laves AI-stemmer?
Nu kan vi vende tilbage til det nørdede og fortælle dig, hvordan AI-stemmer faktisk laves, og hvordan de formår at lyde som menneskestemmer. Bare rolig — vi gør det ikke for kompliceret. Som vi allerede har sagt, bruger stemmekloning AI-teknologi dyb læring til at finde ud af, hvad det præcis er, der gør en stemme til deres egen stemme. Vi taler om tonehøjde, tone, accent, lydstyrke og alt andet, vi forbinder med en persons stemme. Som du kan forestille dig, kræver det kraftig teknologi at finde ud af alt det; men det er muligt. Det, der faktisk er vigtigt, er, at vi fodrer det dybe neurale netværk med masser af lydinput. På en måde er det også sådan, vi lærer fremmedsprog! Selvfølgelig har teknologien udviklet sig nu, og nogle løsninger tager kun et par timer at få den ønskede stemme på plads, hvilket er fantastisk, hvis der ikke er nok lyddata, vi kan bruge (husk hvad vi sagde om historiske figurer).
Stemmekloningsapps
Som du kan forestille dig, er der masser af stemmekloningsapps derude nu, hvor internettet er allestedsnærværende. Selvfølgelig gør nogle et bedre stykke arbejde end andre. Her er nogle af vores bedste valg, som du kan bruge til at lave dine egne syntetiske stemmer og udnytte talesyntesens fulde kraft fra dit eget hjem:
- Respeecher
- Murf
- Resemble
- Descript
Stemmekloningswebsteder
Hvis du er bekendt med TTS-værktøjer, ved du, at du ikke altid behøver at downloade apps for at få arbejdet gjort. I stedet kan du bruge browserudvidelser og hjemmesider for en hurtigere løsning. Det samme gælder for AI-stemme-kloning. Du kan for eksempel bruge noget som Zzlab. Men hvis du vil udnytte syntetiske taleprogrammer bedst muligt, foreslår vi at downloade Speechify eller et af de programmer, vi nævnte ovenfor.
FAQ
Hvad er forskellen mellem stemmekloning og stemmeforvrængning?
Svaret er enkelt: stemmeforvrængning handler om at ændre ens stemme, så den lyder anderledes, det vil sige at føre den gennem en form for digitalt filter. Stemmekloning er derimod en mere kompleks proces, der involverer dybde- og maskinlæring med det formål at skabe en AI-stemme, der kan producere lyd på egen hånd og ikke blot ændre talerens stemme i realtid.
Hvem er den nemmeste person at klone?
Den nemmeste stemmemodel at klone ville være den med mest stemmedata og tilgængelige lydprøver. For eksempel kan du bruge dine egne stemmeoptagelser eller søge efter stemmer fra populære indholdsskabere og berømtheder, fordi algoritmerne allerede favoriserer dem.
Cliff Weitzman
Cliff Weitzman er en fortaler for dysleksi og CEO samt grundlægger af Speechify, verdens førende app til tekst-til-tale, med over 100.000 5-stjernede anmeldelser og førstepladsen i App Store i kategorien Nyheder & Magasiner. I 2017 blev Weitzman udnævnt til Forbes 30 under 30-listen for sit arbejde med at gøre internettet mere tilgængeligt for personer med indlæringsvanskeligheder. Cliff Weitzman har været omtalt i EdSurge, Inc., PC Mag, Entrepreneur, Mashable, blandt andre førende medier.