1. Home
  2. Accessibilità
  3. Testo da foto a voce—Come scattare una foto di una pagina e farla leggere ad alta voce
Social Proof

Testo da foto a voce—Come scattare una foto di una pagina e farla leggere ad alta voce

Speechify è il lettore audio numero 1 al mondo. Leggi libri, documenti, articoli, PDF, email - qualsiasi cosa tu legga - più velocemente.

In Primo Piano In

forbes logocbs logotime magazine logonew york times logowall street logo
Ascolta questo articolo con Speechify!
Speechify

Scopri le basi del testo da foto a voce - Come scattare una foto di una pagina e farla leggere ad alta voce su qualsiasi dispositivo mobile o desktop e sistema operativo.

I lettori TTS sono molto richiesti e ampiamente disponibili. Ma significa che tutta la tecnologia text to speech offre le stesse prestazioni? Molti lettori di schermo TTS possono elaborare testo digitale da documenti Microsoft Word, pagine web HTML o parole copiate e incollate da altri file di testo. Ma pochi di loro possono convertire testo digitale bloccato e fisico da immagini in una narrazione dal suono naturale. Quelli che lo fanno utilizzano il riconoscimento ottico dei caratteri (OCR).

Cos'è l'OCR?

L'OCR, noto come riconoscimento ottico dei caratteri o riconoscimento del testo, è una tecnologia progettata per l'estrazione specializzata di dati. Ha numerose applicazioni aziendali e molti usi nel tempo libero e nell'intrattenimento. Questo tipo di tecnologia di solito ha due componenti. Ha un elemento hardware per scansionare le immagini e un elemento software per estrarre e riutilizzare i dati. Ma la componente software è la parte più entusiasmante e complessa. Il software OCR può individuare singole lettere e intere parole e organizzarle in frasi. Inoltre, consente agli utenti di modificare il contenuto originale bloccato, simile alla modifica di un file PDF con contenuto di testo bloccato.

Come Funziona l'OCR

Il riconoscimento ottico dei caratteri (OCR) è una tecnologia che converte diversi tipi di documenti, come documenti cartacei scansionati, file PDF o immagini catturate da una fotocamera digitale, in dati modificabili e ricercabili. Il processo inizia con il software OCR che analizza la struttura dell'immagine del documento, rilevando le aree che contengono testo. Quindi segmenta queste aree in righe, parole e caratteri. Ogni carattere viene confrontato con un insieme di modelli predefiniti o addestrato con modelli di apprendimento automatico per identificarli e convertirli in testo codificato dalla macchina. Questa conversione consente di modificare, cercare e elaborare digitalmente il testo nell'immagine.

Combinare Testo a Voce e OCR

Combinare il riconoscimento ottico dei caratteri con la tecnologia text to speech crea uno strumento potente che migliora l'accessibilità e l'efficienza. L'OCR estrae il testo da documenti scansionati, immagini o materiali stampati e lo converte in testo leggibile dalla macchina. Questo testo può quindi essere inserito in un sistema TTS, che converte le parole scritte in audio parlato. Questa sinergia consente una vasta gamma di applicazioni, come aiutare le persone con disabilità visive a "leggere" materiali stampati, convertire libri e documenti in audiolibri o fornire traduzioni audio in tempo reale di testi stranieri stampati. Integrando l'OCR con il TTS, gli utenti possono interagire con il contenuto testuale in modo più dinamico, rendendo le informazioni più accessibili a tutti, indipendentemente dalla loro capacità di lettura o disabilità visiva.

Usi per Testo a Voce OCR

Combinare le tecnologie OCR e TTS apre numerose possibilità per rendere le informazioni più accessibili e fruibili in vari scenari. Ecco alcuni usi per il testo a voce OCR:

  • Tecnologia assistiva per persone con disabilità visive: Converte il contenuto scritto da libri, documenti o schermi in parole parlate, aiutando le persone con disabilità visive o cieche a "leggere" il contenuto.
  • Apprendimento e istruzione:
    • Supporto per studenti dislessici: Aiuta gli studenti con dislessia o altre difficoltà di lettura convertendo il testo scritto in audio.
    • Apprendimento multimodale: Consente agli studenti di leggere e ascoltare il contenuto, migliorando la comprensione e la memorizzazione.
  • Traduzione e apprendimento delle lingue: Converte il testo scritto in lingua straniera in parole parlate, aiutando nella pronuncia e comprensione.
  • Consumo di contenuti digitali: Converte libri, articoli di notizie e altri contenuti di testo stampato in audiolibri o podcast per la fruizione in movimento.
  • Accessibilità dei documenti: Rende accessibili PDF, documenti scansionati e altri formati non modificabili a persone che preferiscono o necessitano di contenuti audio.
  • Analisi di documenti storici: Converte manoscritti antichi o documenti d'archivio in contenuti audio per ricercatori o appassionati che vogliono ascoltare testi storici.
  • Business e produttività: Converte rapporti stampati non digitali in contenuti parlati per professionisti impegnati.
  • Correzione di bozze: Aiuta scrittori o editori a identificare errori nel contenuto scritto su carta ascoltandolo.
  • Intrattenimento: Converte fumetti, graphic novel o altri media principalmente visivi in un'esperienza uditiva.

Come Leggere ad Alta Voce il Testo da una Foto

Non tutti gli utenti di dispositivi mobili Apple e Android sanno che le loro app possono avere tecnologia OCR e un lettore TTS in grado di svolgere semplici compiti di conversione da testo a voce. Considera le funzionalità TTS integrate come app che leggono per te gratuitamente o come un'app gratuita che legge il testo dalle fotocamere, tuttavia la loro qualità non è buona come quella dei software di sintesi vocale più avanzati. Ecco come accedere al lettore di testo dalle immagini su dispositivi Android e Apple:

Android

I dispositivi Android, almeno quelli con sistema operativo Android 12 e successivi, dispongono di un lettore TTS integrato. È uno strumento utile per la navigazione, la lettura di caratteri piccoli, ecc. Ma puoi anche usarlo per leggere il testo dalle immagini. Ecco come configurare il tuo dispositivo:

  • Vai al menu “Accessibilità” tramite l'app “Impostazioni”.
  • Abilita l'opzione “Seleziona per parlare”.
  • Vai alla scheda “Impostazioni” del lettore TTS e attiva l'opzione “Leggi testo su immagini”.
  • Torna alla schermata principale e avvia l'app “Fotocamera”.
  • Punta la fotocamera su un libro, un giornale o un altro schermo con testo digitale.
  • Tocca il pulsante “Seleziona per parlare” prima di toccare una parola nell'app “Fotocamera”.

Il lettore TTS Android inizierà a narrare dalla parola evidenziata. Puoi selezionare porzioni di testo trascinando il dito sullo schermo per fare una selezione, come faresti con un elaboratore di testi.

Apple

Leggere ad alta voce il testo fisico utilizzando un iPhone richiede una fotocamera funzionante, iOS 15 e successivi, e l'abilitazione del lettore TTS integrato.

  • Vai alla scheda “Accessibilità” dal menu “Impostazioni”.
  • Tocca la funzione “Contenuto parlato”.
  • Abilita le opzioni “Pronuncia selezione” e “Pronuncia schermo”.
  • Torna alla schermata principale e accendi la fotocamera.
  • Punta la fotocamera su una pagina e attendi che il pulsante “Testo live” appaia sulla barra degli strumenti in basso.
  • Tocca il pulsante per abilitare la lettura dello schermo OCR.
  • Scorri verso il basso con due dita per iniziare a leggere dall'inizio della pagina.
  • Tocca una parola o fai una selezione sullo schermo per leggere ad alta voce una particolare parola, frase o paragrafo.

Come i dispositivi Android, anche iPad e iPhone hanno capacità OCR e TTS limitate. Sebbene l'accuratezza dell'elaborazione delle parole sia superiore alla media, la qualità della voce è deludente a causa della sua natura robotica.

Speechify—Il miglior TTS con tecnologia OCR

Sebbene i lettori TTS integrati e il software OCR siano piacevoli da avere sui dispositivi mobili, la loro qualità e prestazioni sono meno che impressionanti. Fortunatamente, hai un'app alternativa per la lettura del testo. Speechify è un lettore da testo a voce che combina tecnologia OCR e voci AI di alta qualità. La sua funzionalità supera quella dei lettori di testo mobili predefiniti e può scansionare interi libri e documenti fisici per trasformare il testo fisico in testo digitale. Da lì, gli algoritmi complessi generano voci naturali che puoi controllare e regolare alla velocità di lettura desiderata. Il software di sintesi vocale Speechify è disponibile sulle seguenti piattaforme:

Che tu lo ottenga dall'Apple App Store o dal Google Play Store o scarichi la versione desktop per Mac o l'estensione del browser Chrome, una licenza è sufficiente per utilizzare Speechify su tutti i tuoi dispositivi desktop e mobili. L'interfaccia user-friendly è adatta a tutte le fasce d'età e background tecnici. Le scansioni OCR di Speechify sono disponibili per la lettura online in tempo reale.

Progettata per utenti con dislessia, difficoltà di lettura, problemi visivi e multitasker, la tecnologia assistiva di Speechify fa più di un tipico lettore a schermo intero. È l'app che vuoi per trasformare qualsiasi testo digitale e fisico in un audiolibro, creare podcast e migliorare le tue abilità di lettura con meno sforzo e maggiore concentrazione. Prova gratuitamente Speechify l'app di sintesi vocale e personalizza un'esperienza di lettura immersiva.

Cliff Weitzman

Cliff Weitzman

Cliff Weitzman è un sostenitore della dislessia e il CEO e fondatore di Speechify, l'app di sintesi vocale numero 1 al mondo, con oltre 100.000 recensioni a 5 stelle e al primo posto nell'App Store nella categoria Notizie e Riviste. Nel 2017, Weitzman è stato inserito nella lista Forbes 30 under 30 per il suo lavoro nel rendere internet più accessibile alle persone con difficoltà di apprendimento. Cliff Weitzman è stato menzionato in EdSurge, Inc., PC Mag, Entrepreneur, Mashable, tra altri importanti media.