1. Hjem
  2. Tilgjengelighet
  3. Foto til tale
Updated on Tilgjengelighet

Foto til tale

Cliff Weitzman

Cliff Weitzman

Administrerende direktør og grunnlegger av Speechify

apple logoApple Design Award 2025
50M+ brukere

TTS-lesere er populære og finnes i mange varianter. Men betyr det at alle tekst til tale-løsninger gir det samme? Mange TTS-lesere kan lese digital tekst fra Microsoft Word, HTML nettsider, Google Docs eller tekst du har limt inn fra andre filer. Men få av dem kan gjøre om låst digital og fysisk tekst fra bilder til naturlig opplest innhold. De som klarer det bruker optisk tegngjenkjenning (OCR).

Gjør hvilken som helst side om til lyd

Hva er OCR?

OCR, kjent som optisk tegngjenkjenning eller tekstgjenkjenning, er en teknologi laget for spesialisert datauttrekk. Den har mange bruksområder i arbeidsliv og fritid. Teknologien består som regel av to deler: en maskinvaredel for å skanne bilder og en programvaredel som trekker ut og tilpasser data. Det mest spennende og avanserte er programvaren. OCR-programvare kan identifisere enkeltbokstaver og hele ord og sette dem sammen til setninger. Dette lar brukeren redigere innhold som ellers er låst, omtrent som å redigere en PDF med låst tekst.

Slik fungerer OCR

Optisk tegngjenkjenning (OCR) er en teknologi som gjør ulike typer dokumenter – som skannede papirer, PDF-filer eller bilder tatt med kamera – om til redigerbar og søkbar tekst. Prosessen starter med at OCR-programvaren analyserer bildestrukturen og finner hvor det finnes tekst, før den deler opp innholdet i linjer, ord og tegn. Hver bokstav sammenlignes med kjente mønstre eller maskinlæringsmodeller for å gjenkjenne dem og gjøre dem til digital tekst. Slik kan tekst på bildet redigeres, søkes opp og bearbeides digitalt.

Kombinere tekst til tale og OCR

Når du kombinerer optisk tegngjenkjenning med tekst til tale får du et kraftig verktøy for økt tilgjengelighet og effektivitet. OCR henter ut tekst fra skannede dokumenter, bilder eller trykt materiale og gjør det maskinlesbart. Denne teksten mates inn i et TTS-system, som leser den høyt med kunstig stemme. Dermed åpner det for funksjoner som hjelper synshemmede til å «lese» trykt innhold, gjøre bøker og dokumenter om til lydbøker, eller gi sanntids lydoversettelse av trykte fremmedspråktekster. Med OCR og TTS sammen kan alle bruke tekst på nye måter — uansett leseferdigheter eller synsutfordringer.

Bruksområder for tekst til tale OCR

Å kombinere OCR og TTS åpner for mange nye måter å gjøre informasjon mer tilgjengelig på. Her er noen eksempler på bruk av tekst til tale OCR:

  • Hjelpemiddel for synshemmede: Leser opp tekst fra bøker, dokumenter eller skjermer for dem med nedsatt syn.
  • Læring og utdanning:
    • Støtte for dyslektiske elever: Hjelper dem med dysleksi, ADHD eller andre lesevansker ved å gjøre tekst om til lyd.
    • Multimodal læring: Gir mulighet til å både lese og lytte for bedre forståelse og hukommelse.
  • Oversettelse og språklæring: Leser opp tekst på fremmedspråk for å hjelpe med uttale og forståelse.
  • Digitalt innhold: Gjør bøker, nyhetsartikler og annen tekst om til lydbøker eller podkast på farten.
  • Tilgjengelighet på dokumenter: Gjør PDF-er og skannede dokumenter tilgjengelige som lyd for dem som trenger eller foretrekker det.
  • Analyse av historiske dokumenter: Leser opp gamle manuskripter eller arkivmateriale for forskere eller historieinteresserte.
  • Forretning og produktivitet: Leser opp trykte rapporter for travle fagfolk.
  • Korrektur: Hjelper forfattere og redaktører å oppdage feil ved å høre teksten.
  • Underholdning: Gjør tegneserier og grafiske romaner om til en lytteopplevelse.

Slik leser du tekst fra bilde høyt

Ikke alle Apple- og Android-brukere vet at appene deres kan ha OCR og en TTS-leser innebygd for enkle tekst til tale-oppgaver. De innebygde TTS-funksjonene fungerer som apper som leser gratis, eller apper som leser tekst fra kamera—men kvaliteten er dårligere enn i mer avansert tekst til tale-programvare. Slik bruker du tekstleseren fra bilder på Android og Apple:

Android

Android-enheter med Android 12 eller nyere har innebygd TTS-leser. Dette er nyttig for navigasjon, små skriftstørrelser m.m. Du kan også lese tekst fra bilder. Slik gjør du det:

  • Gå til «Tilgjengelighet»-menyen i «Innstillinger».
  • Slå på «Velg for å få opplest».
  • Gå til TTS-leserens «Innstillinger» og aktiver «Les tekst på bilder».
  • Gå tilbake til startskjermen og åpne «Kamera».
  • Pek kameraet mot bok, avis eller skjerm med digital tekst.
  • Trykk på «Velg for å få opplest» før du velger ord i «Kamera».

Android-leseren vil lese fra valgt ord. Du kan merke tekst ved å dra fingeren over skjermen, akkurat som i et tekstbehandlingsprogram.

Apple

For å lese fysisk tekst høyt med iPhone, må du ha kamera, iOS 15+ og ha aktivert den innebygde TTS-leseren.

  • Gå til «Tilgjengelighet» fra «Innstillinger».
  • Trykk på «Opplest innhold».
  • Slå på «Les opp valg» og «Les opp skjerm».
  • Gå tilbake og slå på kameraet.
  • Pek kameraet mot siden og vent til «Live-tekst»-knappen dukker opp.
  • Trykk for å aktivere OCR-opplesning.
  • Stryk ned med to fingre for å lese fra toppen av siden.
  • Trykk eller marker for å lese opp ord, setning eller avsnitt.

Akkurat som Android har iPad og iPhone begrenset OCR og TTS. Tekstlesingen er god, men stemmen er ganske robotaktig.

Speechify—best på TTS med OCR

Innebygde TTS-lesere og OCR-programvare på mobiler imponerer sjelden. Heldigvis finnes det et alternativ: Speechify er en tekst til tale-leser som kombinerer OCR og over 200 naturtro og emosjonelle AI-stemmer på 60+ språk, inkludert kjendisstemmer. Speechify kan skanne hele bøker og dokumenter til digital tekst og videre lage naturtro stemmer i justerbar hastighet. Speechify tekst til tale finnes på disse plattformene:

Enten du laster ned fra App Store, Google Play eller henter Mac-versjonen eller Chrome-utvidelsen, én lisens gir tilgang til Speechify på alle enhetene dine – uansett om du bruker Mozilla, Microsoft, Chromebooks, Apple eller Windows. Grensesnittet er brukervennlig for alle aldre og nivåer. Speechify OCR-skanninger kan også brukes til opplesning direkte i nettleseren.

Speechify er laget for personer med dysleksi, lesevansker, synsutfordringer og for multitaskere. Speechify gjør mer enn standard skjermlesere – det lar deg gjøre digital og fysisk tekst om til lydbøker, podkaster eller rett og slett forbedre lesingen med mindre innsats og mer fokus. Prøv gratis Speechify tekst til tale-appen og skreddersy din leseopplevelse. Speechify har også en nettbasert AI Voice Generator hvor du kan teste stemmene med din egen tekst.

FAQ

Hvilken tekst til tale er mest naturtro? 

Speechify tilbyr 200+ naturtro AI-stemmer på over 60 språk, inkludert dialekter, og oppleves mer naturlig enn konkurrenter som tekst til tale fra Fake You, Nuance og Uberduck

Har Speechify API for tekst til tale?

Ja, Speechify tilbyr en tekst til tale-API tilsvarende Google tekst til tale-API.  

Hvordan lager jeg AI-stemmer? 

Brukere kan lage AI voice-overs for kommersiell bruk enkelt med Speechify Studio

Kan jeg gjøre notater om til podkaster?

Med Speechifys AI-podkast kan brukere gjøre fysisk tekst om til engasjerende AI-podkaster som kan lastes ned som MP3-filer

Nyt de mest avanserte AI-stemmene, ubegrensede filer og support døgnet rundt

Prøv gratis
tts banner for blog

Del denne artikkelen

Cliff Weitzman

Cliff Weitzman

Administrerende direktør og grunnlegger av Speechify

Cliff Weitzman er en forkjemper for dysleksi og administrerende direktør og grunnlegger av Speechify — verdens mest populære tekst-til-tale-app, med over 100 000 femstjerners anmeldelser og som har toppet App Store-kategorien Nyheter og magasiner. I 2017 kom Weitzman på Forbes' «30 under 30»-liste for sitt arbeid med å gjøre internett mer tilgjengelig for personer med lærevansker. Cliff Weitzman har blant annet vært omtalt i EdSurge, Inc., PCMag, Entrepreneur og Mashable.

speechify logo

Om Speechify

#1 tekst-til-tale-leser

Speechify er verdens ledende tekst-til-tale-plattform, med over 50 millioner brukere og mer enn 500 000 femstjerners vurderinger på sine tekst-til-tale-iOS-, Android-, Chrome-utvidelse-, webapp- og Mac-desktop-apper. I 2025 ga Apple Speechify den prestisjetunge Apple Design AwardWWDC, og kalte det «en kritisk ressurs som hjelper folk å leve livene sine». Speechify tilbyr over 1 000 naturtro stemmer på mer enn 60 språk, og brukes i nærmere 200 land. Kjendisstemmer inkluderer Snoop Dogg og Gwyneth Paltrow. For skapere og bedrifter gir Speechify Studio avanserte verktøy, inkludert AI voice generator, AI-stemmekloning, AI-dubbing og AI-stemmebytter. Speechify driver også ledende produkter med sitt høykvalitets, kostnadseffektive tekst-til-tale-API. Omtalt i The Wall Street Journal, CNBC, Forbes, TechCrunch og andre store nyhetskanaler, er Speechify verdens største tekst-til-tale-leverandør. Besøk speechify.com/news, speechify.com/blog og speechify.com/press for å lære mer.