Microsoft převod textu na řeč
Uváděno v
Microsoft dominuje v oblasti podnikání, her a každodenního počítačového využití, ale může Microsoft TTS splnit očekávání?
Řešení převodu textu na řeč (TTS) se stala nepostradatelnou součástí asistivní technologie, která pomáhá nespočtu uživatelů PC komunikovat s psaným slovem, ať už pro zábavu, školu nebo práci.
Jak si asi dokážete představit, trh s TTS je poněkud nasycený, s desítkami aplikací a rozšíření prohlížeče na výběr. Většina z nich je velmi užitečná a výrazně zlepší vaši produktivitu a poskytne vám uživatelsky přívětivější zážitek. Dnes se zaměříme na řešení TTS od Microsoftu — Azure.
Co je Microsoft převod textu na řeč?
Co je tedy Azure? Abychom na tuto otázku odpověděli, můžeme položit jinou: Chcete mít možnost vytvářet obsah s přirozeně znějícími hlasovými přenosy nebo poslouchat své oblíbené stránky, které vám budou předčítány, s řadou přizpůsobitelných parametrů, které vám umožní upravit rychlost řeči, tóny, výslovnost a vše ostatní? Microsoft Azure vám to umožní — a ještě více.
Azure je cloudová platforma plná potenciálu. Kromě kognitivních služeb Azure, které poskytují fantastická řešení převodu textu na řeč a řeč na text, můžete využít úložiště a analytiku Azure k dalšímu zvýšení produktivity, aniž byste museli ovládat složité strojové učení.
Díky kompatibilitě s různými open-source řešeními je Azure také velmi flexibilní. Začlenění hlasových přenosů do vlastních aplikací a umožnění vaší cílové skupině využívat výhody hlubokého strojového učení nebylo nikdy jednodušší, zejména s více než stovkou jazyků a jazykových variant, které vám Azure poskytne.
Jak používat aplikaci Microsoft převod textu na řeč na vašem iPhonu nebo počítači
Nastavení Microsoft Azure na vašem zařízení je poměrně jednoduché a stačí jen pár kliknutí k registraci na oficiálních stránkách Azure. Pokud však vaše používání počítače nepřesahuje aplikace jako Outlook, Word, PowerPoint, Docs a OneNote, nemusíte nic stahovat, protože tyto programy mají vestavěné řešení syntézy řeči nazvané Speak.
I když to nemusí být služba řeči vysoké kvality, Speak se hodí, když jste v úzkých, a je velmi snadné ji nakonfigurovat:
- Klikněte na možnost Přizpůsobit panel nástrojů , klikněte
- Vyberte možnost Další příkazy
- Klikněte na Všechny příkazy
- Najděte Speak, klikněte na něj a poté klikněte na Přidat
Alternativy k aplikaci Microsoft převod textu na řeč
Jak jsme zmínili v úvodu, čtečky textu jsou hojné, od profesionálních aplikací, které vás ohromí už jen svou cenou, až po sotva dokončené SDK pro rozpoznávání řeči na GitHubu. Pokud vám hlasový asistent Microsoft převod textu na řeč nezní jako váš šálek čaje, nebo pokud hledáte nějakou rozmanitost, máme pro vás několik alternativ, které vás jistě zaujmou.
Speechify
Na prvním místě je Speechify, nejlépe hodnocený nástroj TTS, který promění prakticky cokoliv na zvukový soubor. Funguje se všemi aplikacemi Microsoft a jeho modely řeči vás nechají beze slov. Spojte to s vynikajícími schopnostmi API pro řeč a máte univerzální řešení, které vyhoví všem vašim potřebám a případům použití.
Amazon Polly
Na druhém místě máme Amazon Polly, fantastické řešení známé pro své přirozeně znějící hlasy a množství stylů mluvení. Podporuje více jazyků a jeho technologie neuronového převodu textu na řeč vám poskytne spoustu přizpůsobitelných nastavení, se kterými si můžete hrát, kdykoliv chcete přidat šmrnc k vašim již autenticky znějícím přehráváním.
Google Cloud Text to Speech
Na třetím místě je Google Cloud Text to Speech. Přirozeně, kdekoliv je prostor pro technologický pokrok, tam bude Google, a oblast TTS není výjimkou. Řešení od Google se zaměřuje na jazyk pro syntézu řeči (SSML) a funguje na bázi platby za znak, takže je to užitečná a cenově dostupná volba, pokud pracujete na jednorázovém projektu.
IBM Watson Text to Speech
IBM Watson zaujímá čtvrté místo. Co odlišuje Watsona od konkurence, je jeho všestrannost v korporátním prostředí. Můžete ho použít jako virtuálního asistenta nebo nástroj pro zákaznickou podporu a řešení převodu textu na řeč. Navíc je velmi cenově dostupný, takže jinde lepší nabídku nenajdete, pokud hledáte něco flexibilního.
Readspeaker
Na 5. místě máme jednoho z veteránů — Readspeaker. S téměř čtvrtstoletím zkušeností má Readspeaker technologii převodu textu na řeč zvládnutou do detailu. Podporuje více než sto jazyků a je skvělý pro nahrávací studia a e-learning, protože může pracovat jak online, tak offline.
NaturalReader
Na 6. místě je NaturalReader. Tato aplikace skvěle zvládá syntetizovanou řeč v reálném čase a funguje prakticky se všemi aplikacemi, které používáte na svém PC. Co však NaturalReaderu zajistilo místo na našem seznamu, je jeho takzvaný režim čtení, který odstraní z textu veškeré zbytečné prvky, například reklamy.
VoiceDream Reader
Na 7. místě máme VoiceDream Reader, naši poslední alternativu k Microsoft Azure pro dnešek. Bohužel, i když je VoiceDream Reader dobrý pro některé jednodušší úkoly, mnoho uživatelů si stěžuje na nedostatečnou přístupnost a špatné možnosti synchronizace. Pokud ale potřebujete rychlé řešení a nezáleží vám na nejpokročilejších neuronových technologiích TTS a end-to-end technologiích, VoiceDream odvede dostatečně dobrou práci.
Často kladené otázky
Je TTS ve Windows 10 zdarma?
Existuje mnoho řešení TTS pro Windows 10. Některé z nich jsou zdarma, zatímco jiné ne. Vestavěná možnost Speak, která je součástí Windows 10 a funguje například v Outlooku a Wordu, je zdarma, ale sofistikovanější řešení s možnostmi vlastních neuronových hlasů a dalšími funkcemi, jako je Microsoft Azure, vyžadují předplatné.
Který hlas TTS je nejrealističtější?
Nejrealističtější hlasy TTS jsou typické pro pokročilejší nástroje TTS, jako jsou Amazon Polly a Speechify. Úroveň realismu závisí na jazyce, modelu řeči a zvolených parametrech.
Jaký je rozdíl mezi převodem textu na řeč a rozpoznáváním hlasu?
I když mnoho programů TTS nabízí možnosti jak převodu textu na řeč, tak rozpoznávání hlasu, je důležité tyto dvě věci nezaměňovat. Možnosti převodu textu na řeč převedou textový vstup do zvukového formátu, což vám pomůže zapojit se do textu, zatímco plníte jiné úkoly. Rozpoznávání hlasu se na druhou stranu týká analýzy lidského hlasu, buď za účelem interpretace, nebo identifikace.
Cliff Weitzman
Cliff Weitzman je zastáncem dyslexie a CEO a zakladatelem Speechify, nejpopulárnější aplikace pro převod textu na řeč na světě, s více než 100 000 pětihvězdičkovými recenzemi a první příčkou v App Store v kategorii Zprávy a časopisy. V roce 2017 byl Weitzman zařazen na seznam Forbes 30 pod 30 za svou práci na zpřístupnění internetu lidem s poruchami učení. Cliff Weitzman byl uveden v EdSurge, Inc., PC Mag, Entrepreneur, Mashable a dalších předních médiích.