Foto-tekst til tale — sådan tager du et billede af en side og får den læst højt

TTS-læsere er meget efterspurgte og findes i massevis. Men betyder det, at al tekst til tale-teknologi leverer samme kvalitet? Mange TTS-skærmlæsere kan håndtere digital tekst fra Microsoft Word-dokumenter, HTML-websider eller tekst kopieret fra andre filer. Men kun få af dem kan konvertere låst digital og fysisk tekst fra billeder til naturligt lydende oplæsning. Dem, der kan, bruger optisk tegngenkendelse (OCR).

Hvad er OCR?

OCR, kendt som optisk tegngenkendelse eller tekstgenkendelse, er en teknologi udviklet til specialiseret dataudtræk. Den har utallige erhvervsmæssige anvendelser og masser af brug til underholdning og fritid. Denne type teknologi består typisk af to komponenter. Den har et hardwareelement, der scanner billeder, og et softwareelement, der udtrækker og genbruger data. Det er dog softwarekomponenten, som er den mest spændende og komplekse del. OCR-software kan identificere enkelte bogstaver og hele ord og sætte dem sammen til sætninger. Derudover giver den brugeren mulighed for at redigere det oprindelige låste indhold, ligesom når man redigerer en PDF-fil med låst tekstindhold.

Sådan fungerer OCR

Optisk tegngenkendelse (OCR) er en teknologi, der konverterer forskellige typer dokumenter, såsom scannede papirdokumenter, PDF-filer eller billeder taget med et digitalkamera, til redigerbare og søgbare data. Processen starter med, at OCR-softwaren analyserer strukturen af dokumentbilledet og finder de områder, der indeholder tekst. Disse områder deles derefter op i linjer, ord og tegn. Hvert tegn sammenlignes med et sæt foruddefinerede mønstre eller identificeres via maskinlæringsmodeller, så de kan konverteres til maskinkodet tekst. Denne konvertering gør det muligt at redigere, søge i og behandle teksten i billedet digitalt.

Kombiner tekst til tale og OCR

Når optisk tegngenkendelse kombineres med tekst til tale-teknologi, skabes et stærkt værktøj, der øger tilgængelighed og effektivitet. OCR udtrækker tekst fra scannede dokumenter, billeder eller trykt materiale og konverterer det til maskinlæsbar tekst. Denne tekst kan derefter sendes til et TTS-system, som omdanner de skrevne ord til tale. Dette samspil åbner op for et væld af muligheder, såsom at hjælpe synshandicappede med at "læse" trykt materiale, konvertere bøger og dokumenter til lydbøger eller give lydoversættelse i realtid af trykt fremmedsprogstekst. Ved at integrere OCR og TTS kan brugere interagere mere fleksibelt med tekstindholdet og dermed gøre information tilgængelig for alle, uanset læsefærdigheder eller synsnedsættelse.

Anvendelser for tekst til tale OCR

Kombinationen af OCR- og TTS-teknologi åbner for et hav af muligheder for at gøre information mere tilgængelig og nemmere at bruge i hverdagen. Her er nogle anvendelser for tekst til tale OCR:

Hjælpemiddel for synshandicappede: Konverterer skriftligt indhold fra bøger, dokumenter eller skærme til oplæsning, så synshandicappede eller blinde kan "læse" indholdet.
Læring og uddannelse:
- Støtte til elever med dysleksi: Hjælper elever med dysleksi eller andre læseudfordringer ved at omdanne skrevet tekst til lyd.
- Multimodal læring: Giver mulighed for både at læse og lytte til indhold, hvilket kan forbedre forståelse og hukommelse.
Oversættelse og sprogindlæring: Omdanner skrevet tekst på fremmedsprog til tale, hvilket hjælper med udtale og forståelse.
Digitalt indholdsforbrug: Omdanner bøger, nyhedsartikler og anden trykt tekst til lydbøger eller podcasts til brug på farten.
Dokumenttilgængelighed: Gør PDF’er, scannede dokumenter og andre ikke-redigerbare formater tilgængelige for personer, der foretrækker eller har brug for lydindhold.
Analyse af historiske dokumenter: Konverterer gamle manuskripter eller arkivdokumenter til lyd, så forskere eller historieinteresserede kan opleve historiske tekster som lyd.
Erhverv og produktivitet: Omdanner trykte, ikke-digitale rapporter til tale for travle professionelle.
Korrekturlæsning: Hjælper forfattere eller redaktører med at opdage fejl i skriftligt indhold på papir ved at lytte til det.

Underholdning: Omdanner tegneserier, grafiske romaner eller andre primært visuelle medier til en lytteoplevelse.

Sådan får du tekst fra et billede læst op

Ikke alle brugere af Apple- og Android-mobilenheder ved, at deres apps kan have OCR-teknologi og en TTS-læser, som kan klare simple tekst til tale-opgaver. De indbyggede TTS-funktioner fungerer lidt ligesom apps, der læser op for dig gratis, eller en gratis app, der læser tekst via kameraet, men kvaliteten er ikke på højde med mere avanceret tekst til tale-software. Sådan får du adgang til tekstlæser fra billeder på Android- og Apple-enheder:

Android

Android-enheder, i hvert fald dem med Android 12 eller nyere, har en indbygget TTS-læser. Det er et nyttigt værktøj til navigation, læsning af lille tekst osv. Men du kan også bruge den til at læse tekst fra billeder. Sådan sætter du din enhed op:

Gå til menuen “Tilgængelighed” via “Indstillinger”.
Aktivér funktionen “Vælg for at lytte”.
Gå til TTS-læserens faneblad “Indstillinger”, og slå “Læs tekst på billeder” til.
Gå tilbage til startskærmen, og åbn “Kamera”-appen.
Peg kameraet på en bog, avis eller en anden skærm med digital tekst.
Tryk på knappen “Vælg for at lytte”, før du trykker på et ord i “Kamera”-appen.

TTS-læseren på Android begynder at læse op fra det markerede ord. Du kan vælge tekststykker ved at trække fingeren hen over skærmen ligesom i et tekstbehandlingsprogram.

Apple

For at få læst fysisk tekst op via iPhone kræver det et velfungerende kamera, iOS 15 eller nyere samt aktivering af den indbyggede TTS-læser.

Gå til fanen “Tilgængelighed” i menuen “Indstillinger”.
Tryk på funktionen “Talt indhold”.
Aktivér funktionerne “Tal markering” og “Tal skærm”.
Gå tilbage til startskærmen, og tænd for kameraet.
Peg kameraet på siden, og vent på, at “Live tekst”-knappen vises i værktøjslinjen nederst.
Tryk på knappen for at aktivere OCR-skærmlæsning.
Swipe ned med to fingre for at begynde oplæsning fra toppen af siden.
Tryk på et ord eller marker tekst på skærmen for at få et bestemt ord, en sætning eller et afsnit læst op.

Ligesom Android-enheder har iPads og iPhones begrænsede OCR- og TTS-muligheder. Selvom tekstgenkendelsens nøjagtighed er over gennemsnittet, er stemmekvaliteten ret robotagtig.

Speechify — den bedste TTS med OCR-teknologi

Selvom indbyggede TTS-læsere og OCR-software er gode at have på mobilenheder, er deres kvalitet og ydeevne ikke overbevisende. Heldigvis findes der et alternativ til simple tekstlæsningsapps. Speechify er en tekst til tale-læser, der kombinerer OCR-teknologi med AI-stemmer i høj kvalitet. Dens funktionalitet overgår de almindelige læsere på mobilenheder og kan scanne hele bøger og fysiske dokumenter for at konvertere fysisk tekst til digital. Herefter skaber avancerede algoritmer naturligt lydende stemmer, som du selv kan tilpasse, og hvor du kan styre læsehastigheden. Speechify tekst til tale-software fås på følgende platforme:

Windows
macOS
Linux
iOS
Android

Uanset om du henter den fra Apple App Store eller Google Play Store, downloader Mac-versionen til computeren eller installerer Chrome-udvidelsen, kan én licens bruges på alle dine computer- og mobilenheder. Den brugervenlige grænseflade tiltaler både unge og ældre samt personer med enhver teknisk baggrund. Speechify OCR-scanninger er tilgængelige til oplæsning i realtid online.

Speechifys hjælpemiddelsteknologi er udviklet til brugere med dysleksi, læsevanskeligheder, synshandicap og multitaskere og kan meget mere end en almindelig fuldskærmslæser. Det er appen, du skal bruge, hvis du vil forvandle enhver digital og fysisk tekst til en lydbog, lave podcasts og forbedre dine læsefærdigheder med mindre anstrengelse og større fokus. Prøv den gratis Speechify tekst til tale-app, og skræddersy din fordybende læseoplevelse. Speechify har også en online AI Voice Generator som lader dig afprøve stemmerne selv ved at indtaste valgfri tekst.

Speechify er verdens førende tekst-til-tale-platform, betroet af over 50 millioner brugere og med mere end 500.000 femstjernede anmeldelser på sine tekst-til-tale iOS-, Android-, Chrome-udvidelse-, webapp- og Mac desktop-apps. I 2025 tildelte Apple Speechify den prestigefyldte Apple Design Award ved WWDC og kaldte det “en uvurderlig ressource, der hjælper folk med at leve deres liv.” Speechify tilbyder over 1.000 naturligt lydende stemmer på mere end 60 sprog og bruges i næsten 200 lande. Kendte stemmer inkluderer Snoop Dogg, Mr. Beast og Gwyneth Paltrow. For skabere og virksomheder tilbyder Speechify Studio avancerede værktøjer, herunder AI Voice Generator, AI Voice Cloning, AI Dubbing og AI Voice Changer. Speechify driver også førende produkter med sin høj-kvalitets og omkostningseffektive tekst-til-tale API. Omtalt i The Wall Street Journal, CNBC, Forbes, TechCrunch og andre store nyhedsmedier, er Speechify verdens største tekst-til-tale-udbyder. Besøg speechify.com/news, speechify.com/blog og speechify.com/press for at lære mere.

Foto-tekst til tale — sådan tager du et billede af en side og får den læst højt

Cliff Weitzman

#1 Tekst-til-tale læser.
Lad Speechify læse for dig.

Hvad er OCR?

Sådan fungerer OCR

Kombiner tekst til tale og OCR

Anvendelser for tekst til tale OCR