Social Proof

Allt om Deepfake-röster

Speechify är världens främsta ljudläsare. Ta dig igenom böcker, dokument, artiklar, PDF-filer, e-post - allt du läser - snabbare.

Medverkat i

forbes logocbs logotime magazine logonew york times logowall street logo
Lyssna på denna artikel med Speechify!
Speechify

Lär dig vad du behöver för att skapa en deepfake-röst, riskerna med att använda en, och hur du kan använda text-till-tal-programvara som ett alternativ.

Allt om Deepfake-röster

Framväxten av deepfake-media är ett av de hetaste ämnena inom cybersäkerhet och media. Det har olika användningsområden, från att skapa vuxeninnehåll till falska nyheter och ekonomiskt bedrägeri. Att använda någon annans utseende och röst utan deras samtycke i trovärdiga video- och ljudklipp kan verka som ett teknologiskt genombrott inom artificiell intelligens. Men det är inte utan kontroverser.

Vad är en deepfake-röst?

En deepfake-röst är en röst som noggrant efterliknar en verklig persons röst. Även om den är syntetisk, är rösten människolik och kan exakt replikera tonfall, accenter, rytm och andra unika egenskaper.

Personer som skapar deepfake-röster eller röstkloning använder AI-teknologi och kraftfull datorkapacitet. Ibland kan det ta veckor att klona en annan persons röst. Dessutom, förutom specialiserade verktyg och programvara, behöver deepfakes träningsdata. Det innebär ofta att ha tillräckligt med inspelningar av målpersonens röst.

På vissa sätt liknar denna process att använda text-till-tal-programvara för att generera syntetiska röster. Men TTS-programvara skapar vanligtvis naturligt klingande röster utan att försöka replikera en specifik persons röst.

Naturligtvis är det inget fel med att människor klonar sina röster för ljudböcker, röstöverlägg och andra typer av innehåll. Men att skapa deepfake-röster av andra människor utan deras samtycke är en allvarlig fråga.

Riskerna med deepfake-röster

Röstautentisering verkade länge som något ur science fiction-filmer. Tyvärr finns teknologin idag och är långt ifrån ofelbar. När deepfake-röstprogramvara och neurala nätverk utvecklades kunde bedragare göra mer skada.

År 2020 fick en bankchef ett samtal från vad han trodde var en företagsdirektör. Chefen kände igen rösten och hade inga problem med att godkänna en överföring på 35 miljoner dollar. Chefen hade ingen aning om att företagsdirektörens röst var en klonad röst.

Forbes rapporterade om en liknande händelse året innan. Det hände på ett energiföretag i Storbritannien som blev lurade av en deepfake-röst av en betrodd person.

Ännu mer skrämmande är att det är enkelt att få tag på tydliga inspelningar av människors röster. Du kan få dem genom inspelare, onlineintervjuer, presskonferenser, etc. Tekniken för röstupptagning blir också mycket bättre. Därför är data som matas in i AI-modeller mer exakta och leder till mer trovärdiga deepfake-röster.

Cybersäkerhetsverktyg har ännu inte utvecklat idiotsäkra sätt att upptäcka ljuddeepfakes.

Den bästa deepfake-röstprogramvaran

Speechify

Till skillnad från andra verktyg på denna lista är Speechify Voice Over inte en röstkloningsapp. Däremot använder text-till-tal-programvara högkvalitativa AI-algoritmer för att skapa syntetiska medier och naturligt klingande röster. Speechify Voice Over Studio har ett stort bibliotek av människoliknande röster och kan skapa nya baserat på olika parametrar.

Röstkonverteringen från text hjälper människor att läsa tillsammans med skriven text eller skapa podcaster. Den kan till och med göra ljudinspelningar baserat på text du matar in eller skannar. Du kan använda dem för marknadsföring, utgående meddelanden, kundsupportssvar, etc.

Resemble

Resemble AI är en av de mest kraftfulla ljudprogramvarorna för att skapa deepfake-inspelningar. Kloningsprogramvaran behöver inte stora mängder data innan den kan börja klona.

Du kan använda Resemble för att klona din egen röst. I det scenariot är det effektivt för att skapa förinspelade kommersiella klipp eller manus för podcaster, göra annonser, etc. Talssyntesprogramvaran stöder också flera språk och erbjuder olika moduleringsverktyg för att anpassa röster och lägga till intonation eller känsla.

Descript

Descript är ett röstkloningsverktyg med avancerade redigeringsmöjligheter. Det kan arbeta från transkriptioner och ljudklipp för att generera realistiska röster som människor kan använda för övertygande deepfake-videor.

Även om Descript har en hög inlärningskurva, kan de avancerade anpassningsmöjligheterna, skärminspelaren och multitrack-redigeringsfunktionerna hjälpa dig att skapa ultrarealistiska tal i vems röst som helst.

ReSpeecher

Att använda maskininlärningsalgoritmer för att skapa AI-röster som liknar riktiga människor kan vara spännande och en fantastisk affärsidé. ReSpeecher är programvaran som Lucasfilm använde för att skapa Luke Skywalkers röst i The Mandalorian.

Det visar att vissa deepfake-röstprogram kan göra mer än korta klipp för sociala medier. ReSpeecher är mycket efterfrågat tack vare sin högkvalitativa syntetiska talförmåga och beprövade förmåga att efterlikna mänskliga röster.

Röstkloning i realtid

Inte alla har hundratals dollar att spendera varje månad på ReSpeecher eller vänta i användarkön. Vissa vill ha ett mer prisvärt, kanske gratis, alternativ. Röstkloning i realtid är en öppen källkodsprogramvara som alla kan komma åt på GitHub.

Det är inte den enklaste talssyntesprogramvaran att arbeta med för att generera röstinspelningar i en annan persons röst, men det fungerar med mindre ljudklipp. I vissa användningsfall kan ljudproverna vara tillräckliga för att lura Alexa eller göra några busringningar.

iSpeech

iSpeech är en annan gratis röstgenerator med fokus på röstkloning. Den har avancerad taligenkänningsprogramvara och en text-till-tal-läsare. Appen har utökad funktionalitet och en befintlig samling av kändisröster.

Du kan använda iSpeech för att skapa anpassade röst-deepfakes och unika mallar samt spela in din röst. Det är ett mångsidigt verktyg, om än inte lika övertygande som andra på denna lista. Ändå fungerar det som en bra introduktionsapp till deepfake-världen.

Speechify – Skapa naturligt ljudande mänskliga röster

Speechify utnyttjar djupinlärningsalgoritmer för att generera naturligt ljudande mänskliga röster som kan passera som mänskliga utan att klona en specifik persons röst. Även om deepfakes har många cybersäkerhetsproblem, är text-till-tal-programvara generellt mer hjälpsam än skadlig.

Prova Speechify Voice Over Studio för att skapa podcasts och berättelser, läsa komplexa texter enklare, lära sig ett nytt språk och mycket mer.

Vanliga frågor

Är FakeYou gratis?

FakeYou är en begränsad men gratis AI-röstgenerator. Den har ett omfattande bibliotek av röster som låter som kändisar, och vem som helst kan använda den om de inte har något emot de ofta långsamma konverteringstiderna. Trots allt är det enkelt att använda i en webbläsare.

Hur kan man upptäcka deepfake-röster?

Att upptäcka deepfake-röster kräver mycket avancerad programvara och hårdvara för att bryta ner talmönster, bakgrundsljud och andra element.

Vad är skillnaden mellan en deepfake-röst och en röstsyntetisator?

Deepfake-röster syftar ofta på klonade röster, medan röstsyntetisatorer genererar mänskliga röster för kommersiella ändamål.

Cliff Weitzman

Cliff Weitzman

Cliff Weitzman är en förespråkare för dyslexi och VD samt grundare av Speechify, världens främsta app för text-till-tal, med över 100 000 femstjärniga recensioner och förstaplats i App Store i kategorin Nyheter & Tidskrifter. År 2017 blev Weitzman utsedd till Forbes 30 under 30-lista för sitt arbete med att göra internet mer tillgängligt för personer med inlärningssvårigheter. Cliff Weitzman har blivit uppmärksammad i EdSurge, Inc., PC Mag, Entrepreneur, Mashable, bland andra ledande medier.