Watson text to speech: konečný průvodce
Uváděno v
Výkonná prémiová služba převodu textu na řeč, IBM Watson, má co nabídnout. Jak si ale stojí v porovnání se svou cenou? Pojďme to zjistit.
IBM je zcela synonymem pro počítače a moderní technologie. Je to jedna z těch značek jako Microsoft a Apple, které máme vryté do paměti. A to z dobrých důvodů. Vyrábějí některé z nejkvalitnějších softwarových produktů, které nám poskytují spoustu užitečných funkcí pro zlepšení každodenního života.
Jedním z nich je rozhodně IBM Watson. Aplikace pro převod textu na řeč využívající hluboké učení, připravená převést jakýkoli psaný obsah do vysoce kvalitního zvukového souboru pomocí mnoha realisticky znějících hlasů. V následujícím textu vás provedeme detaily této aplikace, abychom zjistili, jak dobře si stojí v porovnání s jejími cenovými plány.
Co je Watson text to speech?
V podstatě je Watson Text to Speech cloudové API, které poskytuje zpracování přirozeného jazyka. Automatizuje AI generované hlasy, které fungují v různých jazycích. Tyto hlasy znějí přirozeně, téměř nerozeznatelně od skutečných lidských hlasů. Je to fantastický software s vynikající funkčností a bez potřeby jakýchkoli tutoriálů.
Můžete jej použít jako virtuálního asistenta pro komunikaci se zahraničními partnery v jejich rodném jazyce, stejně jako eliminovat čekací dobu během interakcí se zákaznickým servisem. Navíc zvyšuje přístupnost pro dyslektiky a lidi s ADHD nebo zrakovým postižením. Ale nepředbíhejme. O jeho případech použití a výhodách si povíme za chvíli.
Funkce
Stejně jako všechny skvělé aplikace, Watson text to speech má svým uživatelům co nabídnout. Není to jen jednoduchý nástroj pro syntézu řeči v reálném čase. Dokáže mnohem víc. Tak se podívejme na některé z jeho nejvýznamnějších funkcí, ano?
Jazyky
Watson Text to Speech podporuje více než 10 různých jazyků. Mezi ně patří angličtina, němčina, italština, čínština, arabština a portugalština. Na rozdíl od některých jiných TTS aplikací můžete importovat text v jednom jazyce a nechat aplikaci přečíst ho nahlas v jiném. To je skvělá funkce, která je velmi užitečná pro studenty cizích jazyků.
Možnosti úprav
I když to není software pro úpravy, můžete si pohrát s některými základními možnostmi manipulace SDK. Například, jakmile otevřete aplikaci Watson text to speech, okamžitě uvidíte dialogové okno, ve kterém můžete začít psát, nebo můžete vložit již napsaný text. Poté můžete vybrat jazyk a pohrát si s hlasem.
Konkrétně můžete volit mezi různými dialekty a hlasy, stejně jako rychlostí a tónem. Například angličtina má americké, britské a australské akcenty, ze kterých si můžete vybrat. Jistě, to není nic revolučního, co by TTS aplikace dnes nabízely, ale stále je to více než dost pro uspokojení průměrného uživatele.
Různé hlasy
Jak bylo zmíněno, každý z jazyků má různé hlasy. To znamená, že pro americkou angličtinu si můžete vybrat z 11 AI vypravěčů. Od Alisson po Michaela, všichni mají jedinečné vlastnosti. Kromě toho, že jsou mužští nebo ženské, někteří jsou více vhodní pro vzdělávací e-learningové voiceovery, zatímco jiní jsou veselí a hodili by se pro YouTube videa.
Co ho odlišuje?
Tak co dělá IBM Watson odlišným od ostatních TTS možností na trhu? Kromě svého značkového jména má tato aplikace opravdu dobré AI hlasy, které jsou všechny neuronové, což znamená realističtější. Za druhé, můžete si vytvořit vlastní hlas, což je vždy příjemný dotek pro tvůrce obsahu.
Ale to není vše. Tento Watson asistent má více co nabídnout. Můžete být předvídaví ohledně výslovnosti slov. To je užitečná funkce pro objasnění neobvyklých slov a učiní váš text profesionálnějším.
Pak je tu vypravěčova expresivita. Každý hlas může mít styl mluvení, včetně GoodNews, Apology a Uncertainty. Spojte to s přizpůsobitelným tónem, hlasitostí a rychlostí, no, je to docela cool.
Výhody použití
To nás přivádí k nejdůležitější otázce. Kdo má největší prospěch z IBM Watson text to speech? No, mnoho lidí. Od malých podnikatelů, kteří chtějí optimalizovat uživatelskou zkušenost s vhodným chatbotem, po jednotlivce, kteří vytvářejí videa pro sociální média nebo e-learning, je to nástroj pro každého z nás. Ale stojí to za to? No, pojďme se podívat.
Cenové plány
I když to není open source aplikace, Watson má bezplatnou verzi. Tento plán se jmenuje Lite. Je to solidní řešení pro každého, kdo si momentálně nemůže dovolit utratit peníze za software pro převod textu na řeč. Můžete přepsat 10 000 znaků měsíčně, použít 35 hlasů a je zde 16 jazyků a dialektů na výběr.
Na druhou stranu existují cenové plány Standard, Premium a Deploy Anywhere. Jejich ceny se liší a můžete kontaktovat IBM, abyste je prodiskutovali. Každý z nich umožňuje neomezenou transkripci, 35 hlasů a všechny jazyky a dialekty. Jediný rozdíl mezi nimi je v integraci s cloudovými službami třetích stran, jako je Google Cloud.
Speechify
Samozřejmě, kromě Watsona existují na trhu převodu textu na řeč i další možnosti. Jednou z nejpopulárnějších aplikací je Speechify a stojí za to ji vyzkoušet. Je založena na modelech strojového učení, umělé inteligenci a OCR algoritmech. Tyto technologie umožňují pořizovat fotografie textu, které Speechify přečte nahlas, kromě základní transkripce textu.
Speechify nabízí přes 30 AI hlasů, které mluví ve více než 15 různých jazycích. Speechify je dostupný na chytrých telefonech s iOS a Androidem, jako aplikace pro počítače s macOS a jako plug-in pro prohlížeče Google Chrome a Safari. Takže, zkuste to a převeďte jakýkoli text na audio.
Často kladené otázky
Můžete používat IBM Watson převod textu na řeč komerčně?
Smlouva SaaS, kterou uzavřete s IBM, stanovuje, že Watson TTS můžete používat pouze pro osobní účely a ne komerčně. Například nemůžete účtovat jiným lidem za přepis jejich textu s vaší licencovanou verzí Watsona.
Jak stáhnu aplikaci Watson pro převod textu na řeč?
Nejprve si budete muset vytvořit účet na IBM cloudu. Jakmile to uděláte, budete přesměrováni na stránku ke stažení, odkud si budete moci vybrat verzi (x64 nebo x86) Watson převodu textu na řeč, která je vhodná pro vaše zařízení.
Cliff Weitzman
Cliff Weitzman je zastáncem dyslexie a CEO a zakladatelem Speechify, nejpopulárnější aplikace pro převod textu na řeč na světě, s více než 100 000 pětihvězdičkovými recenzemi a první příčkou v App Store v kategorii Zprávy a časopisy. V roce 2017 byl Weitzman zařazen na seznam Forbes 30 pod 30 za svou práci na zpřístupnění internetu lidem s poruchami učení. Cliff Weitzman byl uveden v EdSurge, Inc., PC Mag, Entrepreneur, Mashable a dalších předních médiích.