Social Proof

Microsoft převod textu na řeč

Speechify je světová jednička mezi audio čtečkami. Procházejte knihy, dokumenty, články, PDF, e-maily - cokoliv, co čtete - rychleji.

Uváděno v

forbes logocbs logotime magazine logonew york times logowall street logo
Poslechněte si tento článek se Speechify!
Speechify

Microsoft dominuje v oblasti podnikání, her a každodenního počítačového využití, ale může Microsoft TTS splnit očekávání?

Řešení převodu textu na řeč (TTS) se stala nepostradatelnou součástí asistivní technologie, která pomáhá nespočtu uživatelů PC komunikovat s psaným slovem, ať už pro zábavu, školu nebo práci. 

Jak si asi dokážete představit, trh s TTS je poněkud nasycený, s desítkami aplikací a rozšíření prohlížeče na výběr. Většina z nich je velmi užitečná a výrazně zlepší vaši produktivitu a poskytne vám uživatelsky přívětivější zážitek. Dnes se zaměříme na řešení TTS od Microsoftu — Azure.

Co je Microsoft převod textu na řeč?

Co je tedy Azure? Abychom na tuto otázku odpověděli, můžeme položit jinou: Chcete mít možnost vytvářet obsah s přirozeně znějícími hlasovými přenosy nebo poslouchat své oblíbené stránky, které vám budou předčítány, s řadou přizpůsobitelných parametrů, které vám umožní upravit rychlost řeči, tóny, výslovnost a vše ostatní? Microsoft Azure vám to umožní — a ještě více.

Azure je cloudová platforma plná potenciálu. Kromě kognitivních služeb Azure, které poskytují fantastická řešení převodu textu na řeč a řeč na text, můžete využít úložiště a analytiku Azure k dalšímu zvýšení produktivity, aniž byste museli ovládat složité strojové učení.

Díky kompatibilitě s různými open-source řešeními je Azure také velmi flexibilní. Začlenění hlasových přenosů do vlastních aplikací a umožnění vaší cílové skupině využívat výhody hlubokého strojového učení nebylo nikdy jednodušší, zejména s více než stovkou jazyků a jazykových variant, které vám Azure poskytne.

Jak používat aplikaci Microsoft převod textu na řeč na vašem iPhonu nebo počítači

Nastavení Microsoft Azure na vašem zařízení je poměrně jednoduché a stačí jen pár kliknutí k registraci na oficiálních stránkách Azure. Pokud však vaše používání počítače nepřesahuje aplikace jako Outlook, Word, PowerPoint, Docs a OneNote, nemusíte nic stahovat, protože tyto programy mají vestavěné řešení syntézy řeči nazvané Speak.

I když to nemusí být služba řeči vysoké kvality, Speak se hodí, když jste v úzkých, a je velmi snadné ji nakonfigurovat:

  • Klikněte na možnost Přizpůsobit panel nástrojů , klikněte
  • Vyberte možnost Další příkazy
  • Klikněte na Všechny příkazy
  • Najděte Speak, klikněte na něj a poté klikněte na Přidat

Alternativy k aplikaci Microsoft převod textu na řeč

Jak jsme zmínili v úvodu, čtečky textu jsou hojné, od profesionálních aplikací, které vás ohromí už jen svou cenou, až po sotva dokončené SDK pro rozpoznávání řeči na GitHubu. Pokud vám hlasový asistent Microsoft převod textu na řeč nezní jako váš šálek čaje, nebo pokud hledáte nějakou rozmanitost, máme pro vás několik alternativ, které vás jistě zaujmou.

Speechify

Na prvním místě je Speechify, nejlépe hodnocený nástroj TTS, který promění prakticky cokoliv na zvukový soubor. Funguje se všemi aplikacemi Microsoft a jeho modely řeči vás nechají beze slov. Spojte to s vynikajícími schopnostmi API pro řeč a máte univerzální řešení, které vyhoví všem vašim potřebám a případům použití.

Amazon Polly

Na druhém místě máme Amazon Polly, fantastické řešení známé pro své přirozeně znějící hlasy a množství stylů mluvení. Podporuje více jazyků a jeho technologie neuronového převodu textu na řeč vám poskytne spoustu přizpůsobitelných nastavení, se kterými si můžete hrát, kdykoliv chcete přidat šmrnc k vašim již autenticky znějícím přehráváním.

Google Cloud Text to Speech

Na třetím místě je Google Cloud Text to Speech. Přirozeně, kdekoliv je prostor pro technologický pokrok, tam bude Google, a oblast TTS není výjimkou. Řešení od Google se zaměřuje na jazyk pro syntézu řeči (SSML) a funguje na bázi platby za znak, takže je to užitečná a cenově dostupná volba, pokud pracujete na jednorázovém projektu.

IBM Watson Text to Speech

IBM Watson zaujímá čtvrté místo. Co odlišuje Watsona od konkurence, je jeho všestrannost v korporátním prostředí. Můžete ho použít jako virtuálního asistenta nebo nástroj pro zákaznickou podporu a řešení převodu textu na řeč. Navíc je velmi cenově dostupný, takže jinde lepší nabídku nenajdete, pokud hledáte něco flexibilního.

Readspeaker 

Na 5. místě máme jednoho z veteránů — Readspeaker. S téměř čtvrtstoletím zkušeností má Readspeaker technologii převodu textu na řeč zvládnutou do detailu. Podporuje více než sto jazyků a je skvělý pro nahrávací studia a e-learning, protože může pracovat jak online, tak offline.

NaturalReader 

Na 6. místě je NaturalReader. Tato aplikace skvěle zvládá syntetizovanou řeč v reálném čase a funguje prakticky se všemi aplikacemi, které používáte na svém PC. Co však NaturalReaderu zajistilo místo na našem seznamu, je jeho takzvaný režim čtení, který odstraní z textu veškeré zbytečné prvky, například reklamy.

VoiceDream Reader

Na 7. místě máme VoiceDream Reader, naši poslední alternativu k Microsoft Azure pro dnešek. Bohužel, i když je VoiceDream Reader dobrý pro některé jednodušší úkoly, mnoho uživatelů si stěžuje na nedostatečnou přístupnost a špatné možnosti synchronizace. Pokud ale potřebujete rychlé řešení a nezáleží vám na nejpokročilejších neuronových technologiích TTS a end-to-end technologiích, VoiceDream odvede dostatečně dobrou práci.

Často kladené otázky

Je TTS ve Windows 10 zdarma?

Existuje mnoho řešení TTS pro Windows 10. Některé z nich jsou zdarma, zatímco jiné ne. Vestavěná možnost Speak, která je součástí Windows 10 a funguje například v Outlooku a Wordu, je zdarma, ale sofistikovanější řešení s možnostmi vlastních neuronových hlasů a dalšími funkcemi, jako je Microsoft Azure, vyžadují předplatné.

Který hlas TTS je nejrealističtější?

Nejrealističtější hlasy TTS jsou typické pro pokročilejší nástroje TTS, jako jsou Amazon Polly a Speechify. Úroveň realismu závisí na jazyce, modelu řeči a zvolených parametrech.

Jaký je rozdíl mezi převodem textu na řeč a rozpoznáváním hlasu?

I když mnoho programů TTS nabízí možnosti jak převodu textu na řeč, tak rozpoznávání hlasu, je důležité tyto dvě věci nezaměňovat. Možnosti převodu textu na řeč převedou textový vstup do zvukového formátu, což vám pomůže zapojit se do textu, zatímco plníte jiné úkoly. Rozpoznávání hlasu se na druhou stranu týká analýzy lidského hlasu, buď za účelem interpretace, nebo identifikace.

Cliff Weitzman

Cliff Weitzman

Cliff Weitzman je zastáncem dyslexie a CEO a zakladatelem Speechify, nejpopulárnější aplikace pro převod textu na řeč na světě, s více než 100 000 pětihvězdičkovými recenzemi a první příčkou v App Store v kategorii Zprávy a časopisy. V roce 2017 byl Weitzman zařazen na seznam Forbes 30 pod 30 za svou práci na zpřístupnění internetu lidem s poruchami učení. Cliff Weitzman byl uveden v EdSurge, Inc., PC Mag, Entrepreneur, Mashable a dalších předních médiích.