Social Proof

Foto-tekst til tale—Sådan tager du et billede af en side og får den læst op

Speechify er verdens førende lydlæser. Kom hurtigere igennem bøger, dokumenter, artikler, PDF'er, e-mails - alt hvad du læser.

Fremhævet i

forbes logocbs logotime magazine logonew york times logowall street logo
Lyt til denne artikel med Speechify!
Speechify

Lær det grundlæggende om foto-tekst til tale - Sådan tager du et billede af en side og får den læst op på enhver mobil- eller stationær enhed og operativsystem.

Foto-tekst til tale—Sådan tager du et billede af en side og får den læst op

TTS-læsere er i høj efterspørgsel og rigelig udbud. Men betyder det, at al tekst til tale teknologi leverer samme ydeevne? Mange TTS-skærmlæsere kan behandle digital tekst fra Microsoft Word-dokumenter, HTML-websider eller kopierede ord fra andre tekstfiler. Men få af dem kan konvertere låst digital og fysisk tekst fra billeder til naturligt lydende oplæsning. De, der kan, bruger optisk tegngenkendelse (OCR).

Hvad er OCR?

OCR, kendt som optisk tegngenkendelse eller tekstgenkendelse, er en teknologi designet til specialiseret dataudtrækning. Den har mange forretningsmæssige anvendelser og bruges meget i fritid og underholdning. Denne type teknologi har normalt to komponenter. Den har et hardwareelement til at scanne billeder og et softwareelement til at udtrække og genbruge data. Men softwarekomponenten er den mest spændende og komplekse del. OCR-software kan udpege individuelle bogstaver og hele ord og arrangere dem i sætninger. Derudover gør det det muligt for brugere at redigere det originale låste indhold, ligesom at redigere en PDF-fil med låst tekstindhold.

Hvordan OCR fungerer

Den faktiske behandling er fascinerende. Selvom andre to-farve metoder eksisterer, konverterer OCR-software fysiske dokumenter til sort-hvide digitale kopier. Derefter analyserer OCR-appen mørke og lyse områder i billedet, idet den ved, at de mørke områder repræsenterer tegn. Afhængigt af softwarets kompleksitet kan den fokusere på tegn, ord eller tekstblokke samtidig. Derfra identificerer softwaren tegn ved hjælp af funktionsgenkendelse eller mønstergenkendelsesalgoritmer. Funktionsdetektionsalgoritmen bruger en mere kompleks proces, der involverer linje- og kurveforening og ASCII-kodekonverteringer. Uanset en OCR-apps algoritme vil den også analysere dokumentstrukturen for at skelne mellem tekst, tabeller, billeder og andre elementer. På den måde er det eneste, der udtrækkes, teksten. Den største fordel ved denne teknologi er evnen til at tage papirbøger, fysiske dokumenter og trykte lærebøger og konvertere hver side til en digital maskinlæsbar tekst. Denne avancerede behandlingsteknik er allerede kraftfuld i sig selv. Den kan automatisere dataindtastningsprocesser og effektivisere arbejdsgange i mange industrier. Men den giver endnu flere fordele, når den kombineres med kunstig intelligens (AI) og maskinlæringsalgoritmer. AI-aktiveret OCR kan gå ud over standard tekstbehandling og identificere forskellige sprog, håndskriftsstile osv. Kombineret med tekst til tale teknologi kan OCR-software scanne fysiske dokumenter, behandle teksten og tillade en TTS læser at omdanne den digitale tekst til tale.

Anvendelser for tekst til tale OCR

Kombinationen af OCR og TTS-teknologier åbner op for mange muligheder for at gøre information mere tilgængelig og let at forbruge i forskellige scenarier. Her er nogle anvendelser for tekst til tale OCR:

  • Hjælpemiddel til synshandicappede: Konverterer skriftligt indhold fra bøger, dokumenter eller skærme til talte ord, hvilket hjælper synshandicappede eller blinde personer med at "læse" indholdet.
  • Læring og uddannelse:
    • Hjælp til ordblinde elever: Hjælper elever med dysleksi eller andre læseudfordringer ved at konvertere skriftlig tekst til lyd.
    • Multimodal læring: Giver elever mulighed for både at læse og lytte til indhold, hvilket forbedrer forståelse og fastholdelse.
  • Oversættelse og sprogindlæring: Konverterer skriftlig fremmedsprogstekst til talte ord, hvilket hjælper med udtale og forståelse.
  • Digitalt indholdsforbrug: Konverterer bøger, nyhedsartikler og andet trykt tekstindhold til lydbøger eller podcasts til forbrug på farten.
  • Dokumenttilgængelighed: Gør PDF'er, scannede dokumenter og andre ikke-redigerbare formater tilgængelige for folk, der foretrækker eller har brug for lydindhold.
  • Analyse af historiske dokumenter: Konverterer gamle manuskripter eller arkivdokumenter til lydindhold for forskere eller entusiaster, der ønsker at lytte til historiske tekster.
  • Forretning og produktivitet: Konverterer trykte ikke-digitale rapporter til talte indhold for travle professionelle.
  • Korrekturlæsning: Hjælper forfattere eller redaktører med at identificere fejl i skriftligt indhold på papir ved at lytte til det.
  • Underholdning: Konverterer tegneserier, grafiske romaner eller andre primært visuelle medier til en auditiv oplevelse.

Sådan læser du tekst højt fra et billede

Ikke alle Apple- og Android-mobilbrugere ved, at deres apps kan have OCR-teknologi og en TTS-læser, der kan udføre simple tekst til tale-konverteringsopgaver. Overvej de indbyggede TTS-funktioner som apps, der læser for dig gratis, eller som en gratis app, der læser tekst fra kameraer, men deres kvalitet er ikke så god som mere avanceret tekst til tale-software. Her er hvordan du får adgang til tekstlæseren fra billeder på Android- og Apple-enheder:

Android

Android-enheder, i det mindste dem der kører Android 12 OS og nyere, har en indbygget TTS-læser. Det er et nyttigt værktøj til navigation, læsning af små skrifttyper osv. Men du kan også bruge det til at læse tekst fra billeder. Sådan opsætter du din enhed:

  • Gå til menuen “Tilgængelighed” via appen “Indstillinger”.
  • Aktiver “Vælg for at tale” funktionen.
  • Gå til TTS-læserens “Indstillinger” faneblad og slå “Læs tekst på billeder” til.
  • Vend tilbage til din startskærm og start “Kamera” appen.
  • Peg kameraet mod en bog, avis eller en anden skærm med digital tekst.
  • Tryk på “Vælg for at tale” knappen før du trykker på et ord i “Kamera” appen.

TTS Android-læseren vil begynde at fortælle fra det markerede ord. Du kan vælge tekststykker ved at trække din finger hen over skærmen for at lave et valg, som du ville gøre i et tekstbehandlingsprogram.

Apple

At læse fysisk tekst højt ved hjælp af en iPhone kræver et fungerende kamera, iOS 15 og nyere, og aktivering af den indbyggede TTS-læser.

  • Naviger til fanen “Tilgængelighed” fra “Indstillinger” menuen.
  • Tryk på funktionen “Talte indhold”.
  • Aktiver “Tal markering” og “Tal skærm” mulighederne.
  • Gå tilbage til startskærmen og tænd kameraet.
  • Peg kameraet mod en side og vent på, at “Live Text” knappen vises på den nederste værktøjslinje.
  • Tryk på knappen for at aktivere OCR skærmlæsning.
  • Stryg ned med to fingre for at begynde at læse fra toppen af siden.
  • Tryk på et ord eller lav en markering på skærmen for at læse et bestemt ord, sætning eller afsnit højt.

Ligesom Android-enheder har iPads og iPhones begrænsede OCR- og TTS-funktioner. Selvom tekstbehandlingsnøjagtigheden er over gennemsnittet, er stemmekvaliteten skuffende på grund af dens robotagtige natur.

Speechify—Den bedste TTS med OCR-teknologi

Mens indbyggede TTS-læsere og OCR-software er dejlige at have på mobile enheder, er deres kvalitet og ydeevne mindre imponerende. Heldigvis har du et alternativ til læseapps. Speechify er en tekst til tale læser, der kombinerer OCR-teknologi og høj kvalitet AI-genererede stemmer. Dens funktionalitet overgår standard mobile tekstlæsere og kan scanne hele bøger og fysiske dokumenter for at omdanne fysisk tekst til digital tekst. Derfra genererer de komplekse algoritmer naturligt lydende stemmer, som du kan kontrollere og justere til din ønskede læsehastighed. Speechify tekst til tale software er tilgængelig på følgende platforme:

Uanset om du får det fra Apple App Store eller Google Play Store eller downloader desktop Mac-versionen eller Chrome-browserudvidelsen, er én licens nok til at bruge Speechify på alle dine desktop- og mobile enheder. Den brugervenlige grænseflade appellerer til alle aldersgrupper og tekniske baggrunde. Speechify OCR-scanninger er tilgængelige til online læsning i realtid. Alternativt kan du konvertere PDF-filer, skærmbilleder og andre billeder til lydfiler med en høj bitrate og lytte til dem offline i dit eget tempo. Designet til brugere med dysleksi, læsevanskeligheder, synshandicap og multitaskere, Speechifys hjælpende teknologi gør mere end en typisk fuld skærmlæser. Det er appen, du vil bruge til at omdanne enhver digital og fysisk tekst til en lydbog, skabe podcasts og forbedre dine læsefærdigheder med mindre indsats og større fokus. Prøv den gratis Speechify tekst til tale app og personaliser en fordybende læseoplevelse. SEO Titel: Foto tekst til tale – Hvordan man tager et billede af en side og får det læst højt SEO Beskrivelse: Lær det grundlæggende i foto tekst til tale - Hvordan man tager et billede af en side og får det læst højt på enhver mobil- eller desktop-enhed og operativsystem.

Cliff Weitzman

Cliff Weitzman

Cliff Weitzman er en fortaler for dysleksi og CEO samt grundlægger af Speechify, verdens førende app til tekst-til-tale, med over 100.000 5-stjernede anmeldelser og førstepladsen i App Store i kategorien Nyheder & Magasiner. I 2017 blev Weitzman udnævnt til Forbes 30 under 30-listen for sit arbejde med at gøre internettet mere tilgængeligt for personer med indlæringsvanskeligheder. Cliff Weitzman har været omtalt i EdSurge, Inc., PC Mag, Entrepreneur, Mashable, blandt andre førende medier.