Watson tekst til tale ultimative guide
Fremhævet i
En kraftfuld premium tekst-til-tale-tjeneste, IBM Watson har meget at byde på. Men hvordan står det til i forhold til prisen? Lad os finde ud af det.
IBM er fuldstændig synonymt med computere og moderne teknologi. Det er et af de mærker som Microsoft og Apple, der er indgraveret i vores sind. Og med god grund. De producerer nogle af de mest avancerede softwarestykker, der giver os masser af nyttige funktioner til at gøre vores hverdag bedre.
En af disse er helt sikkert IBM Watson. En dyb læring tekst til tale applikation, klar til at transskribere ethvert skriftligt indhold til en lydfil af høj kvalitet gennem adskillige realistisk lydende stemmer. Derfor vil vi i det følgende tage dig igennem appens detaljer for at se, hvordan den står i forhold til sine prisplaner.
Hvad er Watson tekst til tale?
I bund og grund er Watson Tekst til Tale en cloud-baseret API, der leverer naturlig sprogbehandling. Det automatiserer AI-genererede stemmer, der fungerer på forskellige sprog. Disse fortællere lyder alle naturlige, næsten uadskillelige fra faktiske menneskestemmer. Det er et fantastisk stykke software med stor funktionalitet og uden behov for nogen vejledninger.
Du kan bruge det som en virtuel assistent til at kommunikere med udenlandske partnere på deres modersmål samt eliminere ventetid under kundeserviceinteraktioner. Desuden øger det tilgængeligheden for ordblinde og personer med ADHD eller nedsat syn. Men lad os ikke komme forud for os selv her. Vi vil tale om dets anvendelsesmuligheder og fordele om lidt.
Funktioner
Ligesom alle gode apps har Watson tekst til tale meget at tilbyde sine brugere. Det er ikke bare et simpelt realtids tale-synteseværktøj. Det kan meget mere end det. Så lad os se på nogle af dets mest bemærkelsesværdige funktioner, skal vi?
Sprog
Watson Tekst til Tale understøtter over 10 forskellige sprog. Nogle af disse inkluderer engelsk, tysk, italiensk, kinesisk, arabisk og portugisisk. Ikke desto mindre, i modsætning til nogle andre TTS-apps derude, kan du importere tekst på ét sprog og få appen til at læse det højt på et andet. Dette er en fantastisk funktion, der er mest nyttig for fremmedsprogsstuderende.
Redigeringsmuligheder
Selvom dette ikke er et redigeringssoftware, kan du lege med nogle grundlæggende SDK-manipuleringsmuligheder. For eksempel, når du åbner Watson tekst til tale appen, vil du straks se dialogboksen, hvor du kan begynde at skrive, eller du kan indsætte en allerede skrevet tekst. Derefter kan du vælge sproget og justere stemmen.
Nemlig, du kan vælge forskellige dialekter og stemmer samt hastighed og tonehøjde. For eksempel har engelsk amerikanske, britiske og australske accenter, du kan vælge imellem. Ganske vist er dette ikke noget revolutionerende i forhold til, hvad TTS-apps tilbyder i dag, men det er stadig mere end nok til at tilfredsstille en gennemsnitlig bruger.
Stemmemuligheder
Som nævnt har hvert af sprogene forskellige stemmer. Dette betyder, at for amerikansk engelsk kan du vælge mellem 11 AI-fortællere. Fra Alisson til Michael, de har alle unikke karakteristika. Udover at være mandlige eller kvindelige, er nogle mere velegnede til uddannelsesmæssige e-lærings voice-overs, mens andre er muntre og ville passe til YouTube-videoer.
Hvad adskiller det?
Så, hvad gør IBM Watson anderledes end andre TTS-muligheder på markedet? Udover sit brandnavn har denne app virkelig gode AI-stemmer, som alle er neurale, hvilket betyder mere realistiske. For det andet kan du også skabe en brugerdefineret stemme, og dette er altid en fin detalje for indholdsskabere.
Men det er ikke alt. Denne Watson-assistent har mere at byde på. Du kan være forudsigende om ordudtale. Dette er en nyttig funktion til at tydeliggøre usædvanlige ord, og det vil få din tekst til at lyde mere professionel.
Derudover er der fortællerens udtryksfuldhed. Hver stemme kan have en talestil, herunder GoodNews, Apology og Uncertainty. Kombiner det med tilpasselig tonehøjde, volumen og hastighed, ja, det er ret fedt.
Fordele ved brug
Alt dette leder os til det vigtigste spørgsmål. Nemlig, hvem har mest gavn af IBM Watson tekst til tale? Nå, mange mennesker. Fra små virksomhedsejere, der ønsker at optimere brugeroplevelsen med en ordentlig chatbot, til enkeltpersoner, der skaber videoer til sociale medier eller e-læring, det er et værktøj for os alle. Men er det det værd? Lad os se.
Priser
Selvom det ikke er en open source app, har Watson en gratis version. Denne plan hedder Lite. Det er en solid løsning for alle, der ikke kan afsætte penge til et stykke tekst-til-tale-software lige nu. Du kan transskribere 10.000 tegn om måneden, bruge 35 stemmer, og der er 16 sprog og dialekter at vælge imellem.
På den anden side er der Standard, Premium og Deploy Anywhere prisplaner. Deres priser varierer, og du kan kontakte IBM for at diskutere dem. Hver af dem tillader ubegrænset transskription, 35 stemmer og alle sprog og dialekter. Den eneste forskel mellem dem er integrationen med tredjeparts cloud-tjenester som Google Cloud.
Speechify
Selvfølgelig er der, udover Watson, andre muligheder på markedet for tekst-til-tale. En af de mest populære apps er Speechify, og den er værd at tjekke ud. Den er baseret på maskinlæringsmodeller, kunstig intelligens og OCR-algoritmer. Disse kombineret giver dig mulighed for at tage billeder af tekst, og Speechify vil læse dem højt ud over grundlæggende teksttransskription.
Speechify tilbyder over 30 AI-stemmer, der taler på mere end 15 forskellige sprog. Speechify er tilgængelig på iOS- og Android-smartphones, som en app til macOS-computere og som et plug-in til Google Chrome og Safari-browsere. Så, tjek det ud og omdan enhver tekst til lyd.
Ofte stillede spørgsmål
Kan du bruge IBM Watson tekst-til-tale kommercielt?
Den SaaS-aftale, du indgår med IBM, er, at du kun kan bruge Watson TTS til personlig brug og ikke kommercielt. For eksempel kan du ikke opkræve andre for at transskribere deres tekst med din licenserede version af Watson.
Hvordan downloader jeg Watson tekst-til-tale appen?
Først skal du oprette en IBM cloud-konto. Når du har gjort det, vil du blive omdirigeret til download-siden, hvorfra du kan vælge den version (x64 eller x86) af Watson tekst-til-tale, der passer til din enhed.
Cliff Weitzman
Cliff Weitzman er en fortaler for dysleksi og CEO samt grundlægger af Speechify, verdens førende app til tekst-til-tale, med over 100.000 5-stjernede anmeldelser og førstepladsen i App Store i kategorien Nyheder & Magasiner. I 2017 blev Weitzman udnævnt til Forbes 30 under 30-listen for sit arbejde med at gøre internettet mere tilgængeligt for personer med indlæringsvanskeligheder. Cliff Weitzman har været omtalt i EdSurge, Inc., PC Mag, Entrepreneur, Mashable, blandt andre førende medier.