1. Forside
  2. Tilgængelighed
  3. Foto-tekst til tale—Sådan tager du et billede af en side og får den læst højt
Social Proof

Foto-tekst til tale—Sådan tager du et billede af en side og får den læst højt

Speechify er verdens førende lydlæser. Kom hurtigere igennem bøger, dokumenter, artikler, PDF'er, e-mails - alt hvad du læser.

Fremhævet i

forbes logocbs logotime magazine logonew york times logowall street logo
Lyt til denne artikel med Speechify!
Speechify

Lær det grundlæggende om foto-tekst til tale - Sådan tager du et billede af en side og får den læst højt på enhver mobil- eller stationær enhed og operativsystem.

TTS-læsere er i høj efterspørgsel og rigelig udbud. Men betyder det, at al tekst til tale-teknologi leverer samme ydeevne? Mange TTS-skærmlæsere kan behandle digital tekst fra Microsoft Word-dokumenter, HTML-websider eller kopierede ord fra andre tekstfiler. Men få af dem kan konvertere låst digital og fysisk tekst fra billeder til naturligt lydende fortælling. De, der kan, bruger optisk tegngenkendelse (OCR).

Hvad er OCR?

OCR, kendt som optisk tegngenkendelse eller tekstgenkendelse, er en teknologi designet til specialiseret dataudtrækning. Det har mange forretningsmæssige anvendelser og bruges meget i fritid og underholdning. Denne type teknologi har normalt to komponenter. Den har et hardwareelement til at scanne billeder og et softwareelement til at udtrække og genbruge data. Men softwarekomponenten er den mest spændende og komplekse del. OCR-software kan udpege individuelle bogstaver og hele ord og arrangere dem i sætninger. Derudover gør det brugerne i stand til at redigere det oprindelige låste indhold, ligesom man redigerer en PDF-fil med låst tekstindhold.

Hvordan OCR Fungerer

Optisk Tegngenkendelse (OCR) er en teknologi, der konverterer forskellige typer dokumenter, såsom scannede papirdokumenter, PDF-filer eller billeder taget med et digitalt kamera, til redigerbare og søgbare data. Processen begynder med, at OCR-softwaren analyserer strukturen af dokumentbilledet og opdager områder, der indeholder tekst. Den segmenterer derefter disse områder i linjer, ord og tegn. Hvert tegn sammenlignes med et sæt foruddefinerede mønstre eller trænes med maskinlæringsmodeller for at identificere og konvertere dem til maskinkodet tekst. Denne konvertering gør det muligt at redigere, søge og behandle teksten i billedet digitalt.

Kombinere Tekst til Tale og OCR

Kombinationen af optisk tegngenkendelse med tekst til tale-teknologi skaber et kraftfuldt værktøj, der forbedrer tilgængelighed og effektivitet. OCR udtrækker tekst fra scannede dokumenter, billeder eller trykte materialer og konverterer det til maskinlæsbar tekst. Denne tekst kan derefter føres ind i et TTS-system, som konverterer de skrevne ord til talelyd. Denne synergi muliggør en bred vifte af anvendelser, såsom at hjælpe synshandicappede med at "læse" trykte materialer, konvertere bøger og dokumenter til lydbøger eller give realtids lydoversættelser af trykte fremmedsprogstekster. Ved at integrere OCR med TTS kan brugere interagere med tekstindhold mere dynamisk, hvilket gør information mere tilgængelig for alle, uanset deres læseevne eller synshandicap.

Anvendelser for Tekst til Tale OCR

Kombinationen af OCR og TTS-teknologier åbner op for mange muligheder for at gøre information mere tilgængelig og let at forbruge i forskellige scenarier. Her er nogle anvendelser for tekst til tale OCR:

  • Hjælpemidler til synshandicappede: Konverterer skriftligt indhold fra bøger, dokumenter eller skærme til talelyd, hvilket hjælper synshandicappede eller blinde personer med at "læse" indholdet.
  • Læring og uddannelse:
    • Hjælp til ordblinde elever: Hjælper elever med dysleksi eller andre læseudfordringer ved at konvertere skriftlig tekst til lyd.
    • Multimodal læring: Giver elever mulighed for både at læse og lytte til indhold, hvilket forbedrer forståelse og hukommelse.
  • Oversættelse og sprogindlæring: Konverterer skriftlig fremmedsprogstekst til talelyd, hvilket hjælper med udtale og forståelse.
  • Digitalt indholdsforbrug: Konverterer bøger, nyhedsartikler og andet trykt tekstindhold til lydbøger eller podcasts til forbrug på farten.
  • Dokumenttilgængelighed: Gør PDF'er, scannede dokumenter og andre ikke-redigerbare formater tilgængelige for folk, der foretrækker eller har brug for lydindhold.
  • Analyse af historiske dokumenter: Konverterer gamle manuskripter eller arkivdokumenter til lydindhold for forskere eller entusiaster, der ønsker at lytte til historiske tekster.
  • Forretning og produktivitet: Konverterer trykte ikke-digitale rapporter til talelyd for travle professionelle.
  • Korrekturlæsning: Hjælper forfattere eller redaktører med at identificere fejl i skriftligt indhold på papir ved at lytte til det.
  • Underholdning: Konverterer tegneserier, grafiske romaner eller andre primært visuelle medier til en auditiv oplevelse.

Sådan Læser du Tekst Højt fra et Billede

Ikke alle brugere af Apple- og Android-mobilenheder ved, at deres apps kan have OCR-teknologi og en TTS-læser, der kan udføre simple tekst-til-tale-konverteringsopgaver. Overvej de indbyggede TTS-funktioner som apps, der læser for dig gratis, eller som en gratis app, der læser tekst fra kameraer, men deres kvalitet er ikke så god som mere avanceret tekst-til-tale-software. Her er hvordan du får adgang til tekstlæseren fra billeder på Android- og Apple-enheder:

Android

Android-enheder, i det mindste dem der kører Android 12 OS og derover, har en indbygget TTS-læser. Det er et nyttigt værktøj til navigation, læsning af små skrifttyper osv. Men du kan også bruge det til at læse tekst fra billeder. Sådan opsætter du din enhed:

  • Gå til menuen “Tilgængelighed” via appen “Indstillinger”.
  • Aktiver “Vælg for at tale” funktionen.
  • Gå til TTS-læserens “Indstillinger” faneblad og tænd for “Læs tekst på billeder” funktionen.
  • Vend tilbage til din startskærm og start “Kamera” appen.
  • Peg kameraet mod en bog, avis eller en anden skærm med digital tekst.
  • Tryk på “Vælg for at tale” knappen før du trykker på et ord i “Kamera” appen.

TTS Android-læseren vil begynde at fortælle fra det markerede ord. Du kan vælge tekststykker ved at trække din finger hen over skærmen for at lave et valg, som du ville gøre i et tekstbehandlingsprogram.

Apple

At læse fysisk tekst højt ved hjælp af en iPhone kræver et fungerende kamera, iOS 15 og derover, og aktivering af den indbyggede TTS-læser.

  • Naviger til fanen “Tilgængelighed” fra “Indstillinger” menuen.
  • Tryk på funktionen “Talte indhold”.
  • Aktiver “Tal markering” og “Tal skærm” mulighederne.
  • Gå tilbage til startskærmen og tænd for kameraet.
  • Peg kameraet mod en side og vent på, at “Live Text” knappen vises på den nederste værktøjslinje.
  • Tryk på knappen for at aktivere OCR-skærmlæsning.
  • Stryg ned med to fingre for at begynde at læse fra toppen af siden.
  • Tryk på et ord eller lav et valg på skærmen for at læse et bestemt ord, en sætning eller et afsnit højt.

Ligesom Android-enheder har iPads og iPhones begrænsede OCR- og TTS-muligheder. Selvom tekstbehandlingsnøjagtigheden er over gennemsnittet, er stemmekvaliteten skuffende på grund af dens robotagtige natur.

Speechify—Den bedste TTS med OCR-teknologi

Selvom indbyggede TTS-læsere og OCR-software er dejlige at have på mobile enheder, er deres kvalitet og ydeevne mindre imponerende. Heldigvis har du et alternativ til at læse tekst. Speechify er en tekst-til-tale-læser, der kombinerer OCR-teknologi og høj kvalitet AI-genererede stemmer. Dens funktionalitet overgår standard mobile tekstlæsere og kan scanne hele bøger og fysiske dokumenter for at omdanne den fysiske tekst til digital tekst. Derfra genererer de komplekse algoritmer naturligt lydende stemmer, som du kan kontrollere og justere til din ønskede læsehastighed. Speechify tekst-til-tale-software er tilgængelig på følgende platforme:

Uanset om du får det fra Apple App Store eller Google Play Store eller downloader desktop Mac-versionen eller Chrome-browserudvidelsen, er én licens nok til at bruge Speechify på alle dine desktop- og mobile enheder. Den brugervenlige grænseflade appellerer til alle aldersgrupper og tekniske baggrunde. Speechify OCR-scanninger er tilgængelige til online læsning i realtid.

Designet til brugere med dysleksi, læsevanskeligheder, synshandicap og multitaskere, Speechifys hjælpende teknologi gør mere end en typisk fuldskærmslæser. Det er appen, du vil bruge til at omdanne enhver digital og fysisk tekst til en lydbog, skabe podcasts og forbedre dine læsefærdigheder med mindre indsats og større fokus. Prøv den gratis Speechify tekst-til-tale-app og personaliser en fordybende læseoplevelse.

Cliff Weitzman

Cliff Weitzman

Cliff Weitzman er en fortaler for dysleksi og CEO samt grundlægger af Speechify, verdens førende app til tekst-til-tale, med over 100.000 5-stjernede anmeldelser og førstepladsen i App Store i kategorien Nyheder & Magasiner. I 2017 blev Weitzman udnævnt til Forbes 30 under 30-listen for sit arbejde med at gøre internettet mere tilgængeligt for personer med indlæringsvanskeligheder. Cliff Weitzman har været omtalt i EdSurge, Inc., PC Mag, Entrepreneur, Mashable, blandt andre førende medier.