TTS čítačky sú dnes veľmi rozšírené aj dostupné. Znamená to však, že všetky text na reč technológie podávajú rovnaký výkon? Mnohé TTS čítačky si poradia s digitálnym textom z Wordu, HTML stránok či skopírovaných dokumentov, no len máloktoré dokážu previesť uzamknutý text z obrázkov na prirodzený hlas. Tie, ktoré to zvládnu, používajú optické rozpoznávanie znakov (OCR).

Čo je OCR?
OCR – optické rozpoznávanie znakov alebo rozpoznávanie textu – je technológia určená na špecializované získavanie údajov. Uplatňuje sa v biznise aj pri zábave. Zvyčajne zahŕňa hardvér na skenovanie obrázkov a softvér na extrakciu dát. Najzaujímavejšia a najzložitejšia je však softvérová časť. OCR dokáže rozpoznať jednotlivé písmená, slová aj celé vety. Umožňuje aj úpravu pôvodného uzamknutého textu, podobne ako pri editácii PDF so zamknutým textom.
Ako funguje OCR
Optické rozpoznávanie znakov (OCR) premieňa rôzne typy dokumentov – skeny, PDF alebo obrázky z fotoaparátu – na editovateľné a vyhľadateľné údaje. Najskôr softvér OCR analyzuje štruktúru obrázka a nájde textové oblasti. Tie rozdelí na riadky, slová a znaky, ktoré porovná s databázou vzorov alebo ich rozpozná pomocou AI a prevedie na strojovo čitateľný text. Takto sa dá text ďalej upravovať a digitálne spracovať.
Spojenie textu na reč a OCR
Skĺbením OCR a textu na reč vzniká silný nástroj na zvýšenie dostupnosti aj efektivity. OCR zachytí text zo skenov, obrázkov alebo tlačených materiálov a premení ho na čitateľnú podobu. Tú potom TTS systém prečíta nahlas. Vďaka tomu môžu „čítať“ tlačené texty aj nevidiaci, dá sa meniť knihy a dokumenty na audioknihy alebo poskytovať audio preklady cudzích textov. Spolupráca OCR a TTS výrazne rozširuje dostupnosť informácií pre každého, bez ohľadu na čitateľské zručnosti či zrakové obmedzenia.
Využitie OCR pre čítanie textu nahlas
Spojenie OCR a TTS otvára mnoho možností, ako spraviť informácie praktickejšími v rôznych situáciách. Tu je pár príkladov využitia fototextu na reč:
- Asistenčná technológia pre nevidiacich: Mení text z kníh, dokumentov či obrazoviek na hovorené slovo, takže slabozrakí či nevidiaci môžu „čítať“ obsah.
- Vzdelávanie:
- Pomoc pre dyslektikov: Premieňa písaný text na zvuk špeciálne pre tých, čo majú problémy s čítaním.
- Multimodálne učenie: Dá sa čítať aj počúvať, čo zlepšuje pochopenie a zapamätanie.
- Preklady a učenie jazykov: Premieňa cudzí text na hovorené slovo, zjednodušuje výslovnosť a porozumenie.
- Spotreba digitálneho obsahu: Mení knihy, články a tlač na audioknihy alebo podcasty na počúvanie počas dňa.
- Prístupnosť dokumentov: Zlepšuje dostupnosť PDF, skenov a ďalších formátov pre tých, ktorí potrebujú alebo radšej chcú počúvať obsah.
- Analýza historických dokumentov: Premieňa staré rukopisy či archívy na hovorený obsah pre výskumníkov a historikov.
- Biznis a produktivita: Mení tlačené správy na hlasový výstup pre zaneprázdnených profesionálov.
- Kontrola textov: Pomáha autorom či editorom odhaliť chyby v tlačených textoch počúvaním obsahu.
- Zábava: Mení komiksy, grafické romány či vizuálne médiá na zvukový zážitok.
Ako čítať text z obrázka nahlas
Nie každý používateľ Android či Apple zariadenia vie, že mnohé aplikácie už obsahujú OCR a TTS čítačku na jednoduchý prevod textu z obrázkov na reč. Vstavané čítačky sú zadarmo, ale ich kvalita je nižšia než pri pokročilých text na reč softvéroch. Tu je postup, ako si dať nahlas prečítať text z obrázka na Androide a Apple:
Android
Zariadenia s Androidom 12 a vyšším majú vstavanú TTS čítačku. Je užitočná na navigáciu, čítanie malých písmen a pod. Dá sa však použiť aj na čítanie z obrázkov. Tu je návod na nastavenie zariadenia:
- Prejdite na "Prístupnosť" (“Accessibility”) v menu “Nastavenia”.
- Zapnite možnosť "Vybrať a čítať" (“Select to Speak”).
- V záložke TTS čítačky povoľte "Čítať text na obrázkoch" (“Read text on images”).
- Vráťte sa na domovskú obrazovku a spustite "Fotoaparát".
- Namieste kameru na knihu, noviny alebo obrazovku s textom.
- Klepnite na "Vybrať a čítať" (“Select to Speak”) ešte predtým, než sa dotknete slova v aplikácii “Fotoaparát”.
Android čítačka začne čítať od označeného slova. Výber textu upravíte potiahnutím prsta po obrazovke, rovnako ako v textovom editore.
Apple
Čítanie fyzického textu cez iPhone vyžaduje funkčný fotoaparát, iOS 15+ a aktivované TTS čítanie.
- Otvorte "Prístupnosť" v “Nastaveniach”.
- Zvoľte funkciu "Čítaný obsah".
- Zapnite "Čítať výber" a "Čítať obrazovku".
- Prejdite domov a spustite fotoaparát.
- Namieste kameru na stránku a čakajte, kým sa na spodnej lište objaví tlačidlo "Live Text".
- Klepnite na tlačidlo na zapnutie OCR čítania.
- Potiahnite dvoma prstami dolu na začatie čítania odhora.
- Klepnite na slovo alebo vyznačte časť, ktorú chcete prečítať nahlas.
Rovnako ako Androidy, aj iPhony a iPady majú len základné OCR a TTS. Oproti bežnému spracovaniu textu je výsledok nadpriemerný, no hlas stále pôsobí dosť roboticky.
Speechify – Najlepšie TTS s OCR technológiou
Vstavané TTS a OCR čítačky na mobiloch sú fajn, ale ich kvalita a výkon bývajú slabšie. Našťastie existuje alternatívna aplikácia na čítanie textu. Speechify je text na reč čítačka s OCR a špičkovými AI hlasmi. Zvládne aj celé knihy či dokumenty a premení papierový text na digitálny. Pokročilé algoritmy následne vytvoria prirodzený hlas, ktorý si viete nastaviť a meniť tempo čítania. Speechify je dostupný na týchto platformách:
Či už si Speechify stiahnete z App Store, Google Play alebo ako Mac verziu/desktop rozšírenie do Chrome, na použitie všade stačí jediná licencia. Jednoduché ovládanie je vhodné pre všetky vekové skupiny aj úrovne znalostí. Speechify OCR funguje aj na online čítanie v reálnom čase.
Speechify je určená pre dyslektikov, osoby s poruchami čítania, zrakovým postihnutím aj multitaskerov a ponúka viac než bežné čítačky. Zmení akýkoľvek text (digitálny či papierový) na audioknihu, podcast či zlepší vaše čitateľské zručnosti s menšou námahou. Vyskúšajte zadarmo Speechify text na reč a prispôsobte si jedinečný zážitok z čítania. Speechify má aj online AI generátor hlasu – vyskúšajte si jeho hlasy na ľubovoľnom texte.

