TTS čtečky jsou dnes velmi žádané a snadno dostupné. Znamená to ale, že všechny text-to-speech programy umí totéž? Většina TTS čte elektronický text z Wordu, HTML webových stránek, Google Docs nebo ze zkopírovaných souborů. Jen málokterý však dokáže převést uzamčený digitální i tištěný text z obrázků na přirozený hlas. To zvládají nástroje s funkcí optického rozpoznávání znaků (OCR).

Co je OCR?
OCR, česky optické rozpoznávání znaků, je technologie určená pro speciální extrakci dat. Má řadu využití v byznysu i při zábavě. Skládá se ze dvou částí: hardwaru ke snímání obrázků a softwaru pro rozpoznání a úpravu dat. Právě software je tou nejzajímavější a nejsložitější částí. OCR software rozpozná jednotlivá písmena i slova a skládá je do vět. Uživatelé pak mohou upravovat původní uzamčený obsah, podobně jako při editaci PDF s uzamčeným textem.
Jak funguje OCR
Optické rozpoznávání znaků (OCR) převádí různé dokumenty (skeny, PDF nebo fotky) do editovatelné a prohledatelné podoby. Nejprve OCR software analyzuje strukturu dokumentu a rozpozná textová pole. Tato pole dále rozdělí na řádky, slova a znaky. Každý znak porovná se vzory nebo ho rozpozná pomocí strojového učení a převede na strojový text. Výsledkem je text, který lze upravovat, prohledávat a dál digitálně zpracovávat.
Spojení textu na řeč a OCR
Spojení optického rozpoznávání znaků a text-to-speech tvoří silný nástroj pro lepší dostupnost i efektivitu. OCR získá text ze skenů, fotek nebo tištěných materiálů a převede ho na strojový text. Ten pak TTS systém čte nahlas. Taková kombinace je užitečná mj. pro zrakově postižené osoby, kterým „přečte“ tištěné dokumenty nahlas, převádí knihy do audioknih nebo zajišťuje audio překlady tištěných cizojazyčných textů. Pokud spojíte OCR s TTS, může každý text dynamicky využívat a informace jsou snadno přístupné i lidem s poruchou zraku nebo čtení.
Využití OCR pro převod textu na řeč
Spojení OCR a TTS technologií otevírá široké možnosti zpřístupnění a využití textů. Zde je několik způsobů, jak využít převod textu na řeč z fotek:
- Asistenční technologie pro zrakově postižené: Převádí psaný obsah z knih, dokumentů nebo obrazovek na hlas, takže text dokážou „číst“ i nevidomí či lidé se silnou vadou zraku.
- Vzdělávání a výuka:
- Pomoc pro dyslektiky, žáky s ADHD a dalšími poruchami čtení díky převodu textu na zvuk.
- Multimodální učení: Umožňuje zároveň text číst i poslouchat, což zvyšuje pochopení i zapamatování.
- Překlady a učení jazyků: Převádí cizojazyčný psaný text na řeč, což zlepšuje výslovnost i porozumění.
- Digitální obsah: Mění knihy, články i další texty na audioknihy nebo podcasty k poslechu na cestách.
- Zpřístupňování dokumentů: Zajišťuje zvukový výstup z PDF, skenů a needitovatelných souborů pro ty, kdo preferují nebo potřebují audio.
- Analýza historických dokumentů: Zpřístupní staré rukopisy či archivy ve formě audia výzkumníkům i nadšencům historie.
- Byznys a produktivita: Převede tištěné (nedigitální) zprávy na hlas pro zaneprázdněné profesionály.
- Korektura: Pomáhá autorům i editorům odhalit chyby tím, že si mohou text z papíru poslechnout.
- Zábava: Převádí komiksy, grafické romány nebo vizuální média do audio zážitku.
Jak přečíst text z fotky nahlas
Mnoho uživatelů Apple nebo Android zařízení netuší, že jejich mobil už má OCR a TTS čtečku schopnou základního převodu textu na řeč. Můžete využít vestavěné TTS čtečky zdarma nebo aplikace, které čtou text z kamery, ale jejich kvalita obvykle nedosahuje úrovně specializovaného text-to-speech softwaru. Jak zpřístupnit čtečku textu z obrázku na Androidu i Applu:
Android
Zařízení s Androidem 12+ mají vestavěnou TTS čtečku. Ta pomůže např. s navigací či čtením malého písma, ale lze ji použít i ke čtení textů z fotek. Nastavíte ji takto:
- Otevřete „Zpřístupnění“ v aplikaci „Nastavení“.
- Zapněte možnost „Vybrat a vyslovit“.
- Přejděte na záložku „Nastavení“ čtečky TTS a zapněte možnost „Číst text na obrázcích“.
- Vraťte se na domovskou obrazovku a spusťte aplikaci „Fotoaparát“.
- Naměřte kameru na knihu, noviny nebo obrazovku s textem.
- Stiskněte tlačítko „Vybrat a vyslovit“ a poté klepněte na slovo v aplikaci „Fotoaparát“.
Android čtečka začne číst od zvýrazněného slova. Můžete vybrat větší část textu tak, že prstem označíte oblast podobně jako v textovém editoru.
Apple
Pro hlasité čtení tištěného textu iPhonem potřebujete funkční kameru, iOS 15 a vyšší a zapnutou vestavěnou TTS čtečku.
- V menu „Nastavení“ přejděte do záložky „Zpřístupnění“.
- Klepněte na funkci „Čtený obsah“.
- Zapněte možnosti „Číst výběr“ a „Číst obrazovku“.
- Vraťte se na domovskou obrazovku a spusťte kameru.
- Naměřte kameru na stránku a počkejte, až se ve spodním panelu objeví tlačítko „Live Text“.
- Stiskněte tlačítko pro aktivaci OCR čtení obrazovky.
- Přejetím dvěma prsty dolů začnete číst od začátku stránky.
- Klepnutím na slovo nebo výběrem části se přečte konkrétní slovo, věta nebo odstavec.
Stejně jako u Androidů mají i iPady a iPhony omezené možnosti OCR a TTS. Přesnost čtení je nadprůměrná, ale hlas zní stále dost roboticky.
Speechify—nejlepší převod textu na řeč s OCR
Vestavěné TTS čtečky a OCR v mobilech jsou šikovné, ale kvalitou a výkonem zaostávají. Naštěstí existuje lepší aplikace na převod textu. Speechify je text-to-speech čtečka spojující OCR a 200+ realistických emočních AI hlasů ve 60+ jazycích včetně hlasů celebrit. Umí víc než vestavěné čtečky, zvládne naskenovat celé knihy i dokumenty a převést text do digitální podoby. Algoritmy vytvoří velmi přirozený hlas a rychlost čtení si můžete upravit. Speechify text-to-speech software je dostupný pro:
Ať už si aplikaci stáhnete z Apple App Store, Google Play Store, jako desktop verzi pro Mac nebo rozšíření pro Chrome, jedna licence pokryje všechna vaše zařízení, ať už jde o Mozilla, Microsoft, Chromebooky, Apple nebo Windows. Intuitivní rozhraní je vhodné pro všechny věkové i technické skupiny. Speechify OCR lze využít pro online čtení v reálném čase.
Speechify je určeno pro osoby s dyslexií, poruchami čtení, zrakovým postižením či pro ty, kdo rádi multitaskují. Jde o víc než běžnou čtečku – promění jakýkoli text na audioknihu, podcast i vaše čtenářské dovednosti. Využijte zdarma Speechify text-to-speech aplikaci a přizpůsobte si čtení na míru. Speechify nabízí také online AI Voice Generator kde si můžete vyzkoušet různé hlasy zadáním jakéhokoli textu.
FAQ
Který převod textu na řeč zní nejpřirozeněji?
Speechify nabízí 200+ realistických AI hlasů ve více než 60 jazycích včetně přízvuků, takže zní přirozeněji než konkurence (text-to-speech), např. Fake You, Nuance a Uberduck.
Nabízí Speechify API pro převod textu na řeč?
Ano, Speechify má text-to-speech API podobné jako Google text-to-speech API.
Jak mohu vytvořit AI voiceover?
Uživatelé můžou snadno tvořit AI hlasový doprovod pro komerční použití přes Speechify Studio.
Mohu si z poznámek vytvořit podcast?
Díky funkci AI podcast v Speechify lze proměnit jakýkoli psaný obsah na poutavé AI podcasty a stáhnout je jako MP3 soubory.

