Microsoft text till tal
Medverkat i
Microsoft dominerar inom affärsvärlden, spel och vardagsdatoranvändning, men kan Microsoft TTS leva upp till förväntningarna?
Text till tal (TTS) lösningar har blivit en oumbärlig del av hjälpmedelstekniken, som hjälper otaliga PC-användare att interagera med det skrivna ordet, vare sig det är för nöje, skola eller arbete.
Som du kan föreställa dig är TTS-marknaden något mättad, med dussintals appar och webbläsartillägg att välja mellan. De flesta av dem är ganska hjälpsamma och de kommer att göra underverk för din produktivitet och ge dig en mer användarvänlig upplevelse. Idag fokuserar vi på Microsofts TTS-lösning — Azure.
Vad är Microsoft text till tal?
Vad är då Azure? För att svara på den frågan kan vi ställa en annan: Vill du ha kraften att skapa innehåll med naturligt klingande röstöverlägg eller lyssna på dina favoritwebbsidor berättade för dig, med en mängd anpassningsbara parametrar som låter dig justera talhastighet, toner, uttal och allt annat? Microsoft Azure låter dig göra allt det — och mer.
Azure är en molnplattform full av potential. Förutom Azure kognitiva tjänster som erbjuder fantastiska text till tal och tal-till-text-lösningar, kan du använda Azure molnlagring och analys för att ta din produktivitet ännu längre utan att behöva bemästra någon komplicerad maskininlärning.
Genom att vara kompatibel med olika open-source-lösningar är Azure också ganska flexibel. Att integrera röstöverlägg i specialbyggda appar och låta din målgrupp dra nytta av djup maskininlärning har aldrig varit enklare, särskilt med över hundra språk och språkvarianter som Azure ställer till ditt förfogande.
Hur man använder Microsofts text till tal-app på din iPhone eller dator
Att ställa in Microsoft Azure på din enhet är ganska enkelt, och allt som krävs är några klick för att registrera dig på den officiella Azure webbplatsen. Men om din datoranvändning inte sträcker sig bortom program som Outlook, Word, PowerPoint, Docs och OneNote, behöver du inte ladda ner något eftersom dessa program har en inbyggd talsynteslösning som heter Speak.
Även om det kanske inte är en högkvalitativ talservice, är Speak praktisk när du är i knipa, och den är superlätt att konfigurera:
- Klicka på alternativet Anpassa verktygsfältet, klicka
- Välj alternativet Fler kommandon
- Klicka på Alla kommandon
- Hitta Speak, klicka på det och klicka sedan på Lägg till
Alternativ till Microsofts text till tal-applikation
Som vi nämnde i inledningen finns det gott om textläsare, från professionella appar som kommer att imponera på dig bara med sina priser till knappt färdiga taligenkännings-SDK:er på GitHub. Om Microsofts text till tal-röstassistent inte låter som din kopp te, eller om du letar efter lite variation, har vi några alternativ som säkert kommer att väcka ditt intresse.
Speechify
På första plats har vi Speechify, det topprankade TTS-verktyget som förvandlar praktiskt taget vad som helst till en ljudfil. Det fungerar med alla Microsoft-applikationer, och dess talmodeller kommer att lämna dig mållös. Kombinera det med fantastiska tal-API-funktioner, och du har en mångsidig lösning som kommer att tillgodose alla dina behov och användningsfall.
Amazon Polly
På andra plats har vi Amazon Polly, en fantastisk lösning känd för sina naturligt klingande röster och många talstilar. Den stöder flera språk, och dess neurala text till tal-teknik ger dig massor av anpassningsbara inställningar att leka med när du vill lägga till krydda till dina redan autentiskt klingande uppspelningar.
Google Cloud Text to Speech
På tredje plats finns Googles Cloud Text to Speech. Naturligtvis, där det finns tekniska framsteg att göra, kommer Google att vara där, och TTS-området är inget undantag. Googles lösning handlar om tal-syntes markup language (SSML), och det fungerar på en betal-per-tecken-basis, så det är både ett användbart och prisvärt val om du arbetar på ett engångsprojekt.
IBM Watson Text to Speech
IBM Watson tar fjärde plats. Vad som skiljer Watson från konkurrenterna är dess mångsidighet i företagsmiljöer. Nämligen, du kan använda det som en virtuell assistent eller ett kundsupportverktyg och en text till tal-lösning. Dessutom är det superprisvärt, så du kommer inte att få ett bättre erbjudande någon annanstans om du letar efter något flexibelt.
Readspeaker
På plats #5 har vi en av veteranerna — Readspeaker. Med ungefär ett kvarts sekel av erfarenhet har Readspeaker förfinat TTS till en konstform. Det stöder över hundra språk och är fantastiskt för talstudior och e-lärande eftersom det kan fungera både online och offline.
NaturalReader
#6 är NaturalReader. Denna app gör ett utmärkt jobb med realtidssyntetiserat tal och fungerar med i princip alla appar du använder på din PC. Men det som gav NaturalReader en plats på vår lista är dess så kallade läsläge som rensar din text från allt onödigt, till exempel annonser.
VoiceDream Reader
På plats #7 har vi VoiceDream Reader, vårt sista Microsoft Azure text-till-tal-alternativ för idag. Tyvärr, även om VoiceDream Reader är bra för enklare uppgifter, klagar många användare på bristande tillgänglighet och dåliga synkroniseringsalternativ. Men om du behöver en snabb lösning och inte bryr dig om den mest avancerade neurala TTS och end-to-end-teknik, kommer VoiceDream att göra ett tillräckligt bra jobb.
FAQ
Är Windows 10 TTS gratis?
Det finns många TTS-lösningar för Windows 10. Vissa av dem är gratis, medan andra inte är det. Det inbyggda talalternativet som kommer med Windows 10 och fungerar i program som Outlook och Word är gratis, men mer sofistikerade lösningar med anpassade neurala röstalternativ och andra funktioner, som Microsoft Azure, kräver en prenumeration.
Vilken är den mest realistiska TTS-rösten?
De mest realistiska TTS-rösterna är typiska för mer avancerade TTS-verktyg som Amazon Polly och Speechify. Nivåerna av realism beror på språket, talmodellen och de parametrar du väljer.
Vad är skillnaden mellan Text till Tal och Röstigenkänning?
Även om många TTS-program erbjuder både text till tal och röstigenkänningsalternativ, är det viktigt att inte förväxla de två. Text till tal-alternativ omvandlar textinmatning till ljudformat, vilket hjälper dig att engagera dig med texten medan du utför andra uppgifter. Röstigenkänning, å andra sidan, avser en analys av den mänskliga rösten, antingen för att tolka eller identifiera dem.
Cliff Weitzman
Cliff Weitzman är en förespråkare för dyslexi och VD samt grundare av Speechify, världens främsta app för text-till-tal, med över 100 000 femstjärniga recensioner och förstaplats i App Store i kategorin Nyheter & Tidskrifter. År 2017 blev Weitzman utsedd till Forbes 30 under 30-lista för sitt arbete med att göra internet mer tillgängligt för personer med inlärningssvårigheter. Cliff Weitzman har blivit uppmärksammad i EdSurge, Inc., PC Mag, Entrepreneur, Mashable, bland andra ledande medier.