Social Proof

Foto-tekst-naar-spraak—Hoe maak je een foto van een pagina en laat je deze voorlezen

Speechify is de nummer 1 audiolezer ter wereld. Lees sneller door boeken, documenten, artikelen, PDF's, e-mails - alles wat je leest.

Uitgelicht In

forbes logocbs logotime magazine logonew york times logowall street logo
Luister naar dit artikel met Speechify!
Speechify

Leer de basis van foto-tekst-naar-spraak - Hoe maak je een foto van een pagina en laat je deze voorlezen op elk mobiel of desktopapparaat en besturingssysteem.

Foto-tekst-naar-spraak—Hoe maak je een foto van een pagina en laat je deze voorlezen

TTS-lezers zijn zeer gewild en ruim beschikbaar. Maar betekent dat dat alle tekst-naar-spraak technologie dezelfde prestaties levert? Veel TTS-schermlezers kunnen digitale tekst verwerken uit Microsoft Word-documenten, HTML-webpagina's of gekopieerde woorden uit andere tekstbestanden. Maar slechts weinigen kunnen vergrendelde digitale en fysieke tekst uit afbeeldingen omzetten in natuurlijk klinkende vertelling. Degenen die dat wel kunnen, gebruiken optische tekenherkenning (OCR).

Wat is OCR?

OCR, bekend als optische tekenherkenning of tekstherkenning, is een technologie ontworpen voor gespecialiseerde data-extractie. Het heeft talloze zakelijke toepassingen en veel gebruik in vrije tijd en entertainment. Dit type technologie heeft meestal twee componenten. Het heeft een hardware-element om afbeeldingen te scannen en een software-element om gegevens te extraheren en opnieuw te gebruiken. Maar het softwarecomponent is het meest opwindende en complexe deel. OCR-software kan individuele letters en hele woorden onderscheiden en ze in zinnen rangschikken. Bovendien stelt het gebruikers in staat om de originele vergrendelde inhoud te bewerken, vergelijkbaar met het bewerken van een PDF-bestand met vergrendelde tekstinhoud.

Hoe werkt OCR

De daadwerkelijke verwerking is fascinerend. Hoewel er andere tweekleurige methoden bestaan, zet OCR-software fysieke documenten om in zwart-wit digitale kopieën. Vervolgens analyseert de OCR-app donkere en lichte gebieden in de afbeelding, wetende dat de donkere gebieden tekens vertegenwoordigen. Afhankelijk van de complexiteit van de software kan het zich tegelijkertijd richten op tekens, woorden of tekstblokken. Vanaf daar identificeert de software tekens met behulp van kenmerkherkenning of patroonherkenningsalgoritmen. Het kenmerkdetectie-algoritme gebruikt een complexer proces waarbij lijn- en kromme-associatie en ASCII-codeconversies betrokken zijn. Ongeacht het algoritme van een OCR-app, zal het ook de documentstructuur analyseren om onderscheid te maken tussen tekst, tabellen, afbeeldingen en andere elementen. Op die manier wordt alleen de tekst geëxtraheerd. Het belangrijkste voordeel van deze technologie is de mogelijkheid om papieren romans, fysieke documenten en hardcopy leerboeken te nemen en elke pagina om te zetten in een digitale machinaal leesbare tekst. Deze geavanceerde verwerkingstechniek is op zichzelf al krachtig. Het kan gegevensinvoerprocessen automatiseren en workflows in veel industrieën stroomlijnen. Het biedt echter nog meer voordelen wanneer het wordt gecombineerd met kunstmatige intelligentie (AI) en machine learning-algoritmen. AI-gestuurde OCR kan verder gaan dan standaard tekstverwerking en verschillende talen, handschriften, enz. identificeren. Gecombineerd met tekst-naar-spraak-technologie kan OCR-software fysieke documenten scannen, de tekst verwerken en een TTS lezer toestaan die digitale tekst om te zetten in spraak.

Toepassingen van tekst-naar-spraak OCR

Het combineren van OCR- en TTS-technologieën opent talloze mogelijkheden om informatie toegankelijker en consumeerbaarder te maken in verschillende scenario's. Hier zijn een paar toepassingen van tekst-naar-spraak OCR:

  • Hulpmiddelen voor visueel gehandicapten: Zet geschreven inhoud van boeken, documenten of schermen om in gesproken woord, waardoor visueel gehandicapten of blinden de inhoud kunnen "lezen".
  • Leren en educatie:
    • Hulp voor dyslectische studenten: Helpt studenten met dyslexie of andere leesuitdagingen door geschreven tekst om te zetten in audio.
    • Multimodaal leren: Stelt leerlingen in staat om zowel te lezen als te luisteren naar inhoud, wat begrip en retentie verbetert.
  • Vertaling en taal leren: Zet geschreven vreemde taaltekst om in gesproken woord, wat helpt bij uitspraak en begrip.
  • Digitale inhoudsconsumptie: Zet boeken, nieuwsartikelen en andere gedrukte tekstinhoud om in audioboeken of podcasts voor onderweg.
  • Documenttoegankelijkheid: Maakt PDF's, gescande documenten en andere niet-bewerkbare formaten toegankelijk voor mensen die de voorkeur geven aan of behoefte hebben aan audio-inhoud.
  • Analyse van historische documenten: Zet oude manuscripten of archiefdocumenten om in audio-inhoud voor onderzoekers of liefhebbers die historische teksten willen beluisteren.
  • Zakelijk en productiviteit: Zet gedrukte niet-digitale rapporten om in gesproken inhoud voor drukke professionals.
  • Proeflezen: Helpt schrijvers of redacteuren fouten in geschreven inhoud op papier te identificeren door ernaar te luisteren.
  • Entertainment: Zet stripboeken, graphic novels of andere voornamelijk visuele media om in een auditieve ervaring.

Hoe tekst voor te lezen vanaf een foto

Niet elke gebruiker van een Apple- en Android-mobiel apparaat weet dat hun apps mogelijk OCR-technologie en een TTS-lezer hebben die eenvoudige tekst-naar-spraak conversietaken kunnen uitvoeren. Beschouw de ingebouwde TTS-functies als apps die gratis voorlezen of als een gratis app die tekst van camera's leest, hoewel hun kwaliteit niet zo goed is als meer geavanceerde tekst-naar-spraak software. Hier leest u hoe u de tekstlezer van afbeeldingen op Android- en Apple-apparaten kunt openen:

Android

Android-apparaten, tenminste die met Android 12 OS en hoger, hebben een ingebouwde TTS-lezer. Het is een handig hulpmiddel voor navigatie, het lezen van kleine lettertypes, enz. Maar je kunt het ook gebruiken om tekst van foto's te lezen. Hier is hoe je je apparaat instelt:

  • Ga naar het menu "Toegankelijkheid" via de app "Instellingen".
  • Schakel de optie "Selecteer om te spreken" in.
  • Ga naar het tabblad "Instellingen" van de TTS-lezer en zet de optie "Lees tekst op afbeeldingen" aan.
  • Ga terug naar je startscherm en start de app "Camera".
  • Richt de camera op een boek, krant of een ander scherm met digitale tekst.
  • Tik op de knop "Selecteer om te spreken" voordat je op een woord in de app "Camera" tikt.

De TTS Android-lezer begint te vertellen vanaf het gemarkeerde woord. Je kunt tekstgedeelten selecteren door je vinger over het scherm te slepen om een selectie te maken, zoals je zou doen bij het gebruik van een tekstverwerker.

Apple

Fysieke tekst hardop lezen met een iPhone vereist een werkende camera, iOS 15 en hoger, en het inschakelen van de ingebouwde TTS-lezer.

  • Navigeer naar het tabblad "Toegankelijkheid" vanuit het menu "Instellingen".
  • Tik op de functie "Gesproken inhoud".
  • Schakel de opties "Spreek selectie" en "Spreek scherm" in.
  • Ga terug naar het startscherm en zet de camera aan.
  • Richt de camera op een pagina en wacht tot de knop "Live Tekst" verschijnt op de onderste werkbalk.
  • Tik op de knop om OCR-schermlezen in te schakelen.
  • Veeg met twee vingers naar beneden om vanaf de bovenkant van de pagina te beginnen met lezen.
  • Tik op een woord of maak een selectie op het scherm om een specifiek woord, zin of alinea hardop te laten lezen.

Net als Android-apparaten hebben iPads en iPhones beperkte OCR- en TTS-mogelijkheden. Hoewel de nauwkeurigheid van tekstverwerking bovengemiddeld is, is de stemkwaliteit teleurstellend vanwege de robotachtige aard.

Speechify—De beste TTS met OCR-technologie

Hoewel ingebouwde TTS-lezers en OCR-software fijn zijn om op mobiele apparaten te hebben, zijn hun kwaliteit en prestaties minder indrukwekkend. Gelukkig heb je een alternatief voor het lezen van tekst. Speechify is een tekst-naar-spraak lezer die OCR-technologie en hoogwaardige AI-gegenereerde stemmen combineert. De functionaliteit overtreft die van standaard mobiele tekstlezers en kan hele boeken en fysieke documenten scannen om de fysieke tekst om te zetten in digitale tekst. Van daaruit genereren de complexe algoritmen natuurlijk klinkende stemmen die je kunt controleren en aanpassen aan je gewenste leessnelheid. De Speechify tekst-naar-spraak software is beschikbaar op de volgende platforms:

Of je het nu haalt uit de Apple App Store of Google Play Store, of de desktop Mac-versie of de Chrome-browserextensie downloadt, één licentie is genoeg om Speechify op al je desktop- en mobiele apparaten te gebruiken. De gebruiksvriendelijke interface spreekt alle leeftijdsgroepen en technische achtergronden aan. Speechify OCR-scans zijn beschikbaar voor realtime online lezen. Alternatief kun je PDF-bestanden, screenshots en andere afbeeldingen omzetten in audiobestanden met een hoge bitrate en ze offline beluisteren in je eigen tempo. Ontworpen voor gebruikers met dyslexie, leesproblemen, visuele beperkingen en multitaskers, doet de assistieve technologie van Speechify meer dan een typische volledige schermlezer. Het is de app die je wilt om elke digitale en fysieke tekst om te zetten in een audioboek, podcasts te maken en je leesvaardigheden te verbeteren met minder moeite en meer focus. Probeer de gratis Speechify tekst-naar-spraak app en personaliseer een meeslepende leeservaring. SEO Titel: Foto Tekst naar Spraak – Hoe een Foto van een Pagina te Maken en Deze Hardop te Laten Lezen SEO Beschrijving: Leer de basis van foto tekst naar spraak - Hoe een foto van een pagina te maken en deze hardop te laten lezen op elk mobiel of desktopapparaat en besturingssysteem.

Cliff Weitzman

Cliff Weitzman

Cliff Weitzman is een voorvechter van dyslexie en de CEO en oprichter van Speechify, de nummer 1 tekst-naar-spraak app ter wereld, met meer dan 100.000 beoordelingen van 5 sterren en de eerste plaats in de App Store in de categorie Nieuws & Tijdschriften. In 2017 werd Weitzman opgenomen in de Forbes 30 onder 30 lijst voor zijn werk om het internet toegankelijker te maken voor mensen met leerstoornissen. Cliff Weitzman is te zien geweest in EdSurge, Inc., PC Mag, Entrepreneur, Mashable, en andere toonaangevende media.