Social Proof

Hoe je stemklonen kunt doen

Speechify is de #1 AI Voice Over Generator. Maak in real-time voice-over opnames van menselijke kwaliteit. Vertel teksten, video's, uitlegvideo's – alles wat je hebt – in elke stijl.

Op zoek naar onze Tekst-naar-spraak lezer?

Uitgelicht In

forbes logocbs logotime magazine logonew york times logowall street logo
Luister naar dit artikel met Speechify!
Speechify

Stemklonen heeft de potentie om onze benadering van onderwijs, zaken en vrije tijd te revolutioneren. Hier is hoe jij het ook kunt doen.

In tegenstelling tot echt klonen, is stemklonen veilig, eenvoudig te leren en beschikbaar voor vrijwel iedereen met een internetverbinding. Bovendien is het niet alleen praktisch maar ook nuttig, en het verandert de manier waarop we onderwijs, zaken, videogames, literatuur en alles daarbuiten benaderen. Wil je het eens proberen? Blijf dan hangen!

Wat is stemklonen?

Stemklonen is precies wat je je erbij voorstelt — het repliceren en genereren van iemands stem via kunstmatige intelligentie (AI). Het klinkt misschien als sciencefiction, maar we zijn er zeker van dat je er al enige ervaring mee hebt. Herinner je dat tekst-naar-spraak (TTS) programma dat je gebruikte om het nieuws voor te laten lezen in de stem van Arnold Schwarzenegger? Dat is een voorbeeld van stemklonen. Eenvoudige TTS-browserextensies en apps zijn niet zo geavanceerd en krachtig als het gaat om stemklonen. Natuurlijk hoeven ze dat ook niet te zijn, aangezien dat niet hun hoofddoel is. Goede stemkloningsoplossingen gaan veel dieper in hun spraakpatroonanalyses, waardoor ze zich kunnen richten op het benutten van alle details die iemands stem uniek maken. Zoals je kunt raden, betekent meer uitgebreide feedback meer authentieke AI-stemmen en geavanceerdere machine learning.

Toepassingen van stemklonen

Stemklonen is meer dan een gimmick en heeft veel toepassingen in onderwijs, zaken, geneeskunde, enzovoort. Natuurlijk zijn er, net als bij letterlijk klonen, enkele ethische vragen die naar voren kunnen komen (denk maar aan die deepfakes die zijn uitgelekt). Maar we laten filosofische debatten voor een andere dag en proberen de zonnige kant te bekijken.

Onderwijs

Onderwijs is langzaam maar zeker aan het verschuiven naar de digitale wereld. We zijn hier niet om te bespreken welke gevolgen dat kan hebben voor het onderwijssysteem, maar om een eenvoudig feit te benadrukken — schermen en Zoom-gesprekken vervangen klaslokalen en schoolborden. Dat betekent dat we veel middelen tot onze beschikking hebben die we kunnen gebruiken om onze lessen boeiender en leuker te maken. Met stemklonen kunnen we bijvoorbeeld deep learning gebruiken om de stemmen van historische figuren te repliceren. Stel je voor dat je Nikola Tesla hoort uitleggen wat wisselstroom is.

Audioboeken

Dan hebben we audioboeken. Hoewel we ze beschouwen als educatieve hulpmiddelen en een middel tot ontspanning, zijn audioboeken veel belangrijker dan dat. Voor sommige mensen zijn ze de enige manier om met het geschreven woord in aanraking te komen, vooral voor mensen met een visuele beperking. Met stemklonentechnologie kunnen we audioboeken omtoveren tot iets veel leukers en boeienders.

Tekst-naar-spraak diensten

Voordat we zien hoe realtime stemklonen en spraaksynthese werkt, laten we even teruggaan naar TTS-programma's en kijken hoe goed ze hun werk kunnen doen. Laten we bijvoorbeeld eens kijken naar Speechify, een van de meest geavanceerde TTS-oplossingen die beschikbaar zijn. Wat kan Speechify doen? Speechify kan elke tekst omzetten in audiobestanden, het kan fysieke documenten scannen en omzetten in spraak en het kan je helpen bij het maken van voice-overs voor je blog, enzovoort. Waarom noemen we dit allemaal? Omdat TTS-apps betaalbaar en toegankelijk zijn, kunnen ze niet alleen veel profiteren van stemklonen, maar ook helpen om stemklonen naar de mainstream te brengen. Speechify heeft bijvoorbeeld beroemdhedenstemmen, zodat je je favoriete roman kunt beluisteren voorgelezen door Gwyneth Paltrow. Probeer het uit.

Hoe worden AI-stemmen gemaakt?

Nu kunnen we teruggaan naar de technische details en je vertellen hoe AI-stemmen eigenlijk worden gemaakt en hoe ze erin slagen om als menselijke stemmen te klinken. Maak je geen zorgen — we maken het niet te ingewikkeld. Zoals we al zeiden, maakt stemklonen AI-technologie gebruik van deep learning om te achterhalen wat precies iemands stem zijn eigen stem maakt. We hebben het over toonhoogte, klank, accent, volume en alles wat we associëren met de stem van een individu. Zoals je je kunt voorstellen, is er krachtige technologie nodig om dat allemaal te achterhalen; maar het is mogelijk. Wat eigenlijk belangrijk is, is dat we het diepe neurale netwerk veel audio-invoer geven. Op een bepaalde manier is het ook hoe we vreemde talen leren! Natuurlijk is de technologie nu geëvolueerd, en sommige oplossingen hebben slechts een paar uur nodig om de gewenste stem vast te leggen, wat fantastisch is als er niet genoeg audiodata beschikbaar is (denk aan wat we zeiden over historische figuren).

Stemklonen Apps

Zoals je je kunt voorstellen, zijn er nu veel stemklonen apps beschikbaar nu het internet alomtegenwoordig is. Natuurlijk doen sommige het beter dan andere. Hier zijn enkele van onze topkeuzes die je kunt gebruiken om je eigen synthetische stemmen te maken en de volledige kracht van spraaksynthese vanuit het comfort van je huis te benutten:

  • Respeecher
  • Murf
  • Resemble
  • Descript

Stemklonen Websites

Als je bekend bent met TTS-tools, weet je dat je niet altijd apps hoeft te downloaden om de klus te klaren. In plaats daarvan kun je browserextensies en websites gebruiken voor een snellere oplossing. Hetzelfde geldt voor AI-stemklonen. Je kunt bijvoorbeeld iets als Zzlab gebruiken. Maar als je optimaal gebruik wilt maken van synthetische spraakprogramma's, raden we aan om Speechify of een van de hierboven genoemde programma's te downloaden.

Veelgestelde Vragen

Wat is het verschil tussen stemklonen en stemvervorming?

Het antwoord is eenvoudig: stemvervorming is simpelweg het veranderen van iemands stem om deze anders te laten klinken, door het door een soort digitaal filter te halen. Stemklonen daarentegen is een complexer proces dat gebruikmaakt van deep learning en machine learning met als doel een AI-stem te creëren die zelfstandig audio kan produceren en niet alleen de stem van de spreker in realtime aanpast.

Wie is het gemakkelijkst om te klonen?

Het gemakkelijkst te klonen stemmodel zou degene zijn met de meeste stemgegevens en audiomonsters beschikbaar. Je kunt bijvoorbeeld je eigen stemopnamen gebruiken of op zoek gaan naar de stemmen van populaire contentmakers en beroemdheden, omdat de algoritmen hen al bevoordelen.

Cliff Weitzman

Cliff Weitzman

Cliff Weitzman is een voorvechter van dyslexie en de CEO en oprichter van Speechify, de nummer 1 tekst-naar-spraak app ter wereld, met meer dan 100.000 beoordelingen van 5 sterren en de eerste plaats in de App Store in de categorie Nieuws & Tijdschriften. In 2017 werd Weitzman opgenomen in de Forbes 30 onder 30 lijst voor zijn werk om het internet toegankelijker te maken voor mensen met leerstoornissen. Cliff Weitzman is te zien geweest in EdSurge, Inc., PC Mag, Entrepreneur, Mashable, en andere toonaangevende media.