1. Avaleht
  2. Juurdepääsetavus
  3. Foto tekst kõneks – kuidas pildistada lehte ja lasta see ette lugeda
Avaldatud Juurdepääsetavus

Foto tekst kõneks – kuidas pildistada lehte ja lasta see ette lugeda

Cliff Weitzman

Cliff Weitzman

Speechify tegevjuht/asutaja

apple logo2025. aasta Apple'i disainiauhind
50M+ kasutajat

TTS lugejate järele on suur nõudlus ja neid on palju. Aga kas kõik teksti kõneks lahendused pakuvad sama head tulemust? Enamik TTS-ekraanilugejaid suudab töödelda digitaalteksti Microsoft Wordi dokumentidest, HTML-veebilehtedelt või muud tüüpi failidest. Vähesed neist suudavad aga teisendada piltidel olevat lukustatud või füüsilist teksti loomuliku kõlaga kõneks. Need, mis seda teevad, kasutavad optilise märgituvastuse (OCR) tehnoloogiat.

Muuda iga leht kõneväljundiks

Mis on OCR?

OCR ehk optiline märgituvastus (tekstituvastus) on tehnoloogia teksti automaatseks tuvastamiseks. Seda kasutatakse äris, igapäevaelus ja meelelahutuses. OCR-il on tavaliselt kaks osa: riistvara pildi skaneerimiseks ning tarkvara andmete eraldamiseks ja ümbertöötlemiseks. Peamine ja põnevam pool on tarkvara – see tunneb ära tähed, sõnad ja paneb neist kokku laused. Lisaks saab muidu lukustatud teksti, näiteks PDF-failides, hiljem redigeerida.

Kuidas OCR töötab

Optiline märgituvastus (OCR) muudab näiteks skannitud dokumendid, PDF-id või digikaamera pildid redigeeritavaks ja otsitavaks tekstiks. Tarkvara analüüsib dokumendi ülesehitust, tuvastab tekstiosad ning jagab need ridadeks, sõnadeks ja märkideks. Iga märki võrreldakse mustritega või tuvastatakse masinõppemudelite abil ning teisendatakse masinloetavaks tekstiks. Nii saab pildil oleva teksti digitaalselt töödelda.

Teksti kõneks ja OCR ühendamine

OCR-i ja teksti kõneks tehnoloogia ühendamine teeb info palju kättesaadavamaks ja kiiremaks tarbida. OCR tuvastab teksti piltidelt, skaneeritud dokumentidelt või trükimaterjalidelt ning muudab selle masinloetavaks tekstiks, mida TTS-tarkvara saab ette lugeda. Selline lahendus aitab näiteks nägemispuudega inimesi, muudab raamatud või dokumendid helifailideks, võimaldab trükitud võõrkeelset teksti reaalajas kõnesse tõlkida. OCR ja TTS lubavad tekstiga suhelda paindlikumalt – info muutub kõigile lihtsamini kättesaadavaks, sõltumata lugemisoskustest või -võimetest.

Teksti kõneks ja OCR-i kasutusvaldkonnad

OCR-i ja TTS-i kooskasutus avab palju võimalusi info paremini kättesaadavaks tegemiseks erinevates olukordades. Siin on mõned foto teksti kõneks kasutusalad:

  • Abitehnoloogia nägemispuudega inimestele: loeb ette teksti raamatutest, dokumentidest või ekraanidelt, aidates neil sisu „lugeda”.
  • Õppimine ja haridus:
    • Toetus düsleksiaga õpilastele: muudab teksti kõneks ja toetab lugemisraskustega õppijaid.
    • Mitmemoodiline õppimine: võimaldab kuulata ja lugeda korraga, parandades arusaamist ja meelespidamist.
  • Tõlge ja keeleõpe: võõrkeelse teksti ettelugemine parandab hääldust ja mõistmist.
  • Digitaalse sisu tarbimine: muudab raamatud, artiklid ja muu trükitud teksti audioraamatuteks või taskuhäälinguks liikvel olles.
  • Dokumentide ligipääsetavus: teeb PDF-id ja muud muudetamatud formaadid kõigile kuulatavaks.
  • Ajalooliste dokumentide analüüs: muudab vanad käsikirjad ja arhiivid kuulatavaks, sobides uurijatele ja huvilistele.
  • Äri ja produktiivsus: loeb prinditud aruanded kiiretele spetsialistidele ette.
  • Korrektuur: aitab autoritel ja toimetajatel vigu leida, lastes teksti valju häälega ette lugeda.
  • Meelelahutus: muudab koomiksid, graafilised romaanid ja muu visuaalse meedia kuuldavaks kogemuseks.

Kuidas pildilt teksti ette lugeda

Paljud Apple'i ja Androidi kasutajad ei teagi, et nende seadmetes võib olla OCR-i ja TTS-i tugi, mis võimaldab lihtsalt teksti kõneks muuta. Sisseehitatud TTS-funktsioonid võivad olla tasuta abirakendused, mis loevad teksti pildilt, kuid nende kvaliteet jääb alla parematele teksti kõneks programmidele. Siit leiad juhised, kuidas Androidi ja Apple'i seadmetes kasutada piltidelt teksti ettelugemist:

Android

Android-seadmetel (Android 12 ja uuemad) on sisseehitatud TTS-lugeja. See sobib näiteks navigeerimiseks või lühikese teksti lugemiseks. Samuti saab lugeda teksti piltidelt. Seadista seade nii:

  • Ava „Seaded” ja sealt menüü „Juurdepääsetavus”.
  • Lülita sisse „Select to Speak”.
  • Mine TTS-lugeja seadistustesse ja aktiveeri valik „Loe teksti piltidelt”.
  • Naase avakuvale ja ava „Kaamera” rakendus.
  • Suuna kaamera raamatu, ajalehe või muu teksti ekraani poole.
  • Vajuta „Select to Speak” nuppu ja puuduta seejärel mõnda sõna „Kaamera” äpis.

Androidi TTS-lugeja alustab ettelugemist tähistatud sõnast. Tekstikatkeid saab valida sõrmega, sarnaselt tekstitöötlusprogrammis valimisele.

Apple

Teksti ettelugemiseks iPhone'is on vaja töötavat kaamerat, iOS 15 või uuemat versiooni ning sisse lülitatud TTS-lugejat.

  • Ava „Seaded” ja vali „Juurdepääsetavus”.
  • Vali „Spoken Content”.
  • Lülita sisse „Speak Selection” ja „Speak Screen”.
  • Naase avakuvale ja ava kaamera.
  • Suuna kaamera lehe poole ja oota, kuni kuvatakse „Live Text” nupp.
  • Puuduta nuppu, et lubada OCR ja ekraanilugemine.
  • Libista kahe sõrmega alla, et alustada ettelugemist lehe ülaosast.
  • Puuduta sõna või vali ekraanil tekstiosa, mida soovid ette lugeda.

Nagu Androidi seadmetel, on ka iPadidel ja iPhone’idel OCR-i ja TTS-i võimalused piiratud. Kuigi tekstituvastus on üsna täpne, kõlab hääl siiski mõnevõrra robotlikult.

Speechify – parim TTS koos OCR-iga

Sisseehitatud TTS-lugejad ja OCR-tarkvarad on mugavad, kuid nende kvaliteet ja tulemus võivad jääda tagasihoidlikuks. Õnneks on olemas tugev alternatiiv – Speechify on teksti kõneks lugeja, mis ühendab OCR-tehnoloogia ja kvaliteetsed AI-hääled. See ületab tavalisi mobiilseid tekstilugejaid – suudab skannida ja töödelda terveid raamatuid ja paberdokumente digitekstiks. Nutikas algoritm loeb seejärel teksti ette loomuliku kõlaga häälega, mille kiirust saad ise valida. Speechify teksti kõneks tarkvara on saadaval nendel platvormidel:

Laadi Speechify alla Apple'i App Store'ist, Google Playst, Maci töölauale või Chrome'i laiendusena – ühe litsentsiga saad seda kasutada kõigis oma seadmetes. Lihtne liides sobib nii algajale kui ka kogenud kasutajale. Speechify OCR töötab reaalajas, et lugeda teksti ette otse võrgus.

Speechify sobib düsleksiaga, lugemisraskustega, nägemispuudega inimestele ja ka neile, kes armastavad mitut asja korraga teha – see pakub rohkem kui tavaline ekraanilugeja. Sellega saad muuta füüsilise või digitaalse teksti audioraamatuks, teha taskuhäälingut või lihvida lugemisoskust lihtsamalt ja keskendunumalt. Proovi Speechify kõnetarkvara tasuta ja kohanda lugemiskogemus endale sobivaks. Speechify’s on ka veebipõhine AI Voice Generator, millega saad oma teksti prooviks ette lugeda lasta.

Naudi tipptasemel AI-hääli, piiramatult faile ja ööpäevaringset kliendituge

Proovi tasuta
tts banner for blog

Jaga seda artiklit

Cliff Weitzman

Cliff Weitzman

Speechify tegevjuht/asutaja

Cliff Weitzman on düsleksia eestkõneleja ning Speechify tegevjuht ja asutaja. Speechify on maailma populaarseim kõnesünteesi rakendus, millel on üle 100 000 viietärnilise arvustuse ja mis on App Store'is Uudiste & Ajakirjade kategoorias esikohal. 2017. aastal kanti Weitzman Forbesi „30 alla 30” nimekirja tema töö eest interneti ligipääsetavuse parandamisel õpiraskustega inimestele. Cliff Weitzmanist on kirjutanud ka EdSurge, Inc, PC Mag, Entrepreneur, Mashable ja paljud teised juhtivad väljaanded.

speechify logo

Speechify'st

#1 tekst kõneks rakendus

Speechify on maailma juhtiv tekst kõneks platvorm, mida usaldab üle 50 miljoni kasutaja ja millele on antud enam kui 500 000 viietärnilist arvustust selle tekstist kõneks tehnoloogia eest iOS-, Android-, Chrome Extension-, veebirakendus- ja Mac desktop-rakendustes. 2025. aastal pälvis Speechify Apple’ilt prestiižse Apple’i disainiauhinna WWDC-l, nimetades seda „oluliseks ressursiks, mis aitab inimestel paremini elada.” Speechify pakub üle 1 000 loodusliku kõlaga hääle rohkem kui 60 keeles ning seda kasutatakse ligi 200 riigis. Kuulsuste häältest on saadaval näiteks Snoop Dogg ja Gwyneth Paltrow. Loojatele ja ettevõtetele pakub Speechify Studio täiustatud tööriistu, sh AI-häälegeneraatorit, AI-häälekloonimist, AI-dubleerimist ja AI-häälevahetust. Speechify panustab ka juhtivatesse toodetesse tänu kvaliteetsele ja kuluefektiivsele tekst kõneks API-le. Esindatud näiteks The Wall Street Journal, CNBC, Forbes, TechCrunch ja muudes juhtivates meediakanalites, on Speechify maailma suurim kõnesünteesi teenusepakkuja. Vaata lisaks: speechify.com/news, speechify.com/blog ja speechify.com/press.