1. Startpagina
  2. Toegankelijkheid
  3. Foto-tekst-naar-spraak—Hoe maak je een foto van een pagina en laat je deze voorlezen
Social Proof

Foto-tekst-naar-spraak—Hoe maak je een foto van een pagina en laat je deze voorlezen

Speechify is de nummer 1 audiolezer ter wereld. Lees sneller door boeken, documenten, artikelen, PDF's, e-mails - alles wat je leest.

Uitgelicht In

forbes logocbs logotime magazine logonew york times logowall street logo
Luister naar dit artikel met Speechify!
Speechify

Leer de basis van foto-tekst-naar-spraak - Hoe maak je een foto van een pagina en laat je deze voorlezen op elk mobiel of desktopapparaat en besturingssysteem.

TTS-lezers zijn erg in trek en ruim beschikbaar. Maar betekent dat dat alle tekst-naar-spraak-technologie dezelfde prestaties levert? Veel TTS-schermlezers kunnen digitale tekst verwerken uit Microsoft Word-documenten, HTML-webpagina's of gekopieerde woorden uit andere tekstbestanden. Maar slechts weinigen kunnen vergrendelde digitale en fysieke tekst uit afbeeldingen omzetten in natuurlijk klinkende vertelling. Degenen die dat wel kunnen, gebruiken optische tekenherkenning (OCR).

Wat is OCR?

OCR, bekend als optische tekenherkenning of tekstherkenning, is een technologie ontworpen voor gespecialiseerde data-extractie. Het heeft talloze zakelijke toepassingen en veel gebruik in vrije tijd en entertainment. Dit type technologie heeft meestal twee componenten. Het heeft een hardware-element om afbeeldingen te scannen en een software-element om data te extraheren en opnieuw te gebruiken. Maar de softwarecomponent is het meest opwindende en complexe deel. OCR-software kan individuele letters en hele woorden onderscheiden en ze in zinnen rangschikken. Bovendien stelt het gebruikers in staat om de originele vergrendelde inhoud te bewerken, vergelijkbaar met het bewerken van een PDF-bestand met vergrendelde tekstinhoud.

Hoe werkt OCR

Optische tekenherkenning (OCR) is een technologie die verschillende soorten documenten, zoals gescande papieren documenten, PDF-bestanden of afbeeldingen gemaakt met een digitale camera, omzet in bewerkbare en doorzoekbare data. Het proces begint met de OCR-software die de structuur van de documentafbeelding analyseert en gebieden detecteert die tekst bevatten. Vervolgens segmenteert het deze gebieden in regels, woorden en tekens. Elk teken wordt vergeleken met een set vooraf gedefinieerde patronen of getraind met machine learning-modellen om ze te identificeren en om te zetten in machinaal gecodeerde tekst. Deze conversie maakt het mogelijk om de tekst in de afbeelding digitaal te bewerken, te doorzoeken en te verwerken.

Combineren van Tekst-naar-Spraak en OCR

Het combineren van optische tekenherkenning met tekst-naar-spraak-technologie creëert een krachtig hulpmiddel dat toegankelijkheid en efficiëntie verbetert. OCR haalt tekst uit gescande documenten, afbeeldingen of gedrukte materialen en zet deze om in machinaal leesbare tekst. Deze tekst kan vervolgens worden ingevoerd in een TTS-systeem, dat de geschreven woorden omzet in gesproken audio. Deze synergie maakt een breed scala aan toepassingen mogelijk, zoals het helpen van visueel gehandicapten om gedrukte materialen te "lezen", boeken en documenten om te zetten in audioboeken, of het bieden van realtime audiovertalingen van gedrukte buitenlandse teksten. Door OCR te integreren met TTS kunnen gebruikers dynamischer omgaan met tekstuele inhoud, waardoor informatie toegankelijker wordt voor iedereen, ongeacht hun leesvaardigheid of visuele beperking.

Toepassingen voor Tekst-naar-Spraak OCR

Het combineren van OCR- en TTS-technologieën opent talloze mogelijkheden om informatie toegankelijker en consumeerbaarder te maken in verschillende scenario's. Hier zijn een paar toepassingen voor tekst-naar-spraak OCR:

  • Hulpmiddelen voor visueel gehandicapten: Zet geschreven inhoud van boeken, documenten of schermen om in gesproken woord, waardoor visueel gehandicapten of blinden de inhoud kunnen "lezen".
  • Leren en educatie:
    • Hulp voor dyslectische studenten: Helpt studenten met dyslexie of andere leesuitdagingen door geschreven tekst om te zetten in audio.
    • Multimodaal leren: Stelt leerlingen in staat om zowel te lezen als te luisteren naar inhoud, wat begrip en retentie verbetert.
  • Vertaling en taal leren: Zet geschreven vreemde taaltekst om in gesproken woord, wat helpt bij uitspraak en begrip.
  • Digitale inhoudsconsumptie: Zet boeken, nieuwsartikelen en andere gedrukte tekstinhoud om in audioboeken of podcasts voor onderweg.
  • Documenttoegankelijkheid: Maakt PDF's, gescande documenten en andere niet-bewerkbare formaten toegankelijk voor mensen die de voorkeur geven aan of behoefte hebben aan audio-inhoud.
  • Analyse van historische documenten: Zet oude manuscripten of archiefdocumenten om in audio-inhoud voor onderzoekers of liefhebbers die historische teksten willen beluisteren.
  • Zakelijk en productiviteit: Zet gedrukte niet-digitale rapporten om in gesproken inhoud voor drukke professionals.
  • Proeflezen: Helpt schrijvers of redacteuren fouten in geschreven inhoud op papier te identificeren door ernaar te luisteren.
  • Entertainment: Zet stripboeken, graphic novels of andere voornamelijk visuele media om in een auditieve ervaring.

Hoe tekst voorlezen vanaf een foto

Niet elke gebruiker van Apple- en Android-mobiele apparaten weet dat hun apps mogelijk OCR-technologie en een TTS-lezer hebben die eenvoudige tekst-naar-spraakconversietaken kunnen uitvoeren. Beschouw de ingebouwde TTS-functies als apps die gratis voorlezen of als een gratis app die tekst van camera's leest, hoewel hun kwaliteit niet zo goed is als meer geavanceerde tekst-naar-spraaksoftware. Hier leest u hoe u de tekstlezer van afbeeldingen op Android- en Apple-apparaten kunt openen:

Android

Android-apparaten, althans die met Android 12 OS en hoger, hebben een ingebouwde TTS-lezer. Het is een handig hulpmiddel voor navigatie, het lezen van kleine lettertypen, enz. Maar je kunt het ook gebruiken om tekst van foto's te lezen. Hier leest u hoe u uw apparaat instelt:

  • Ga naar het menu "Toegankelijkheid" via de app "Instellingen".
  • Schakel de optie "Selecteer om te spreken" in.
  • Ga naar het tabblad "Instellingen" van de TTS-lezer en schakel de optie "Lees tekst op afbeeldingen" in.
  • Ga terug naar uw startscherm en start de app "Camera".
  • Richt de camera op een boek, krant of een ander scherm met digitale tekst.
  • Tik op de knop "Selecteer om te spreken" voordat u op een woord in de app "Camera" tikt.

De TTS-lezer op Android begint te vertellen vanaf het gemarkeerde woord. U kunt tekstgedeelten selecteren door uw vinger over het scherm te slepen om een selectie te maken, zoals u zou doen bij het gebruik van een tekstverwerker.

Apple

Fysieke tekst hardop lezen met een iPhone vereist een werkende camera, iOS 15 en hoger, en het inschakelen van de ingebouwde TTS-lezer.

  • Navigeer naar het tabblad "Toegankelijkheid" in het menu "Instellingen".
  • Tik op de functie "Gesproken inhoud".
  • Schakel de opties "Spreek selectie" en "Spreek scherm" in.
  • Ga terug naar het startscherm en zet de camera aan.
  • Richt de camera op een pagina en wacht tot de knop "Live Tekst" verschijnt op de onderste werkbalk.
  • Tik op de knop om OCR-schermlezen in te schakelen.
  • Veeg met twee vingers naar beneden om vanaf de bovenkant van de pagina te beginnen met lezen.
  • Tik op een woord of maak een selectie op het scherm om een bepaald woord, zin of alinea hardop te laten voorlezen.

Net als Android-apparaten hebben iPads en iPhones beperkte OCR- en TTS-mogelijkheden. Hoewel de nauwkeurigheid van de tekstverwerking bovengemiddeld is, is de stemkwaliteit teleurstellend vanwege de robotachtige aard.

Speechify—De Beste TTS met OCR-technologie

Hoewel ingebouwde TTS-lezers en OCR-software fijn zijn om op mobiele apparaten te hebben, zijn hun kwaliteit en prestaties niet indrukwekkend. Gelukkig is er een alternatieve app voor het lezen van tekst. Speechify is een tekst-naar-spraak lezer die OCR-technologie en hoogwaardige AI-gegenereerde stemmen combineert. De functionaliteit overtreft die van standaard mobiele tekstlezers en kan hele boeken en fysieke documenten scannen om de fysieke tekst om te zetten in digitale tekst. Van daaruit genereren de complexe algoritmen natuurlijk klinkende stemmen die je kunt controleren en aanpassen aan je gewenste leessnelheid. De Speechify tekst-naar-spraak software is beschikbaar op de volgende platforms:

Of je het nu haalt uit de Apple App Store of Google Play Store, of de desktop Mac-versie of de Chrome-browserextensie downloadt, één licentie is voldoende om Speechify op al je desktop- en mobiele apparaten te gebruiken. De gebruiksvriendelijke interface spreekt alle leeftijdsgroepen en technische achtergronden aan. Speechify OCR-scans zijn beschikbaar voor realtime online lezen.

Ontworpen voor gebruikers met dyslexie, leesproblemen, visuele beperkingen en multitaskers, doet de assistieve technologie van Speechify meer dan een typische schermlezer. Het is de app die je wilt gebruiken om elke digitale en fysieke tekst om te zetten in een audioboek, podcasts te maken en je leesvaardigheid te verbeteren met minder inspanning en meer focus. Probeer de gratis Speechify tekst-naar-spraak app en personaliseer een meeslepende leeservaring.

Cliff Weitzman

Cliff Weitzman

Cliff Weitzman is een voorvechter van dyslexie en de CEO en oprichter van Speechify, de nummer 1 tekst-naar-spraak app ter wereld, met meer dan 100.000 beoordelingen van 5 sterren en de eerste plaats in de App Store in de categorie Nieuws & Tijdschriften. In 2017 werd Weitzman opgenomen in de Forbes 30 onder 30 lijst voor zijn werk om het internet toegankelijker te maken voor mensen met leerstoornissen. Cliff Weitzman is te zien geweest in EdSurge, Inc., PC Mag, Entrepreneur, Mashable, en andere toonaangevende media.