Els sintetitzadors de veu són sistemes per convertir text escrit en veu humana. Com un dels primers sintetitzadors de veu al mercat, eSpeak s'ha utilitzat àmpliament arreu del món. L'actual versió eSpeakNG millora molt les primeres versions del programa. Tot i així, continua tenint diverses mancances i limitacions.
Vegem les millors alternatives a eSpeak que solucionen amb èxit aquests problemes.
Què és eSpeak?
eSpeak és un sintetitzador de veu de codi obert allotjat a GitHub. Utilitza síntesi formàntica, així que no fa servir mostres de veu humana en temps real. Per això, ofereix molts idiomes en una mida molt compacta.
Tot i això, la qualitat dels idiomes varia molt. Alguns requereixen millores, i és aquí on entra en joc el feedback dels parlants nadius. Aquests usuaris fan servir sobretot el programari com a lector de pantalla.
Aquesta funció és possible gràcies al mètode de síntesi, que produeix un text prou intel·ligible. Així, els usuaris amb discapacitat visual poden navegar per l'ordinador sense errors acústics. A més, es poden exportar totes les veus com a fitxer de so WAV .
Avantatges i desavantatges d'eSpeak
Gràcies a la mida reduïda, eSpeak es pot distribuir de diverses maneres:
- Un programa de línia d'ordres per a Windows i Linux com a lector de text a veu
- Una biblioteca compartida per a altres programes a Windows i Linux
- Un lector de pantalla per a Windows, Android i macOS
A banda de la mida, el gran nombre d'idiomes disponibles és un altre avantatge clau d'eSpeak. Ofereix síntesi de text a veu en més de 270 idiomes, amb opció d'afegir-ne més.
Aquests idiomes es poden llegir amb diferents veus i característiques. Pots:
- Canviar l'altura de la veu
- Afegir eco
- Afegir xiuxiueig
- Fer servir una veu rogallosa
Tot i això, hi ha inconvenients en l'oferta d'idiomes i veus que utilitza el programari.
Molts idiomes només estan en esborrany i cal molta feina fins que siguin del tot funcionals. Milloren amb el feedback dels usuaris. Ara com ara, idiomes com l'anglès i el castellà tenen molta més qualitat.
Pel que fa a la veu, és clara i es pot accelerar. Però, com que no és gravada d'humans, no sona natural ni suau. De fet, la majoria sonen una mica robòtiques.
Alternatives a eSpeak
A causa de les seves limitacions, molts només fan servir eSpeak per a escolta bàsica de blogs o notícies. Per a usos més avançats, cal buscar alternatives.
Speechify
Speechify és una aplicació potent de text a veu compatible amb Mac, iPhone i Android. També es pot utilitzar en línia o com a extensió de Chrome a Windows.
El més destacat de Speechify respecte a eSpeak són les veus naturals. Escoltar una veu robòtica molta estona pot resultar pesat. Per això, Speechify utilitza veus amb IA molt realistes i humanes, que ajuden a concentrar-se i retenir millor la informació.
A més, tots els idiomes tenen el mateix nivell de desenvolupament. Els usuaris poden esperar veus naturals per llegir articles o textos en molts formats.
També poden convertir fotos i captures de pantalla en documents d'escolta.
NaturalReader
NaturalReader és una altra alternativa versàtil a eSpeak, disponible en línia i fora de línia. Admet la majoria de formats de documents, materials impresos, documents escanejats i captures de diferents dispositius.
Aquest TTS ofereix veus naturals en 16 idiomes i permet als usuaris ajustar la pronunciació de qualsevol paraula a la seva llengua.
TextAloud
TextAloud és un programa de text a veu per a Windows. Permet transformar text de documents i pàgines web en veu natural. Pots escoltar-ho al PC o exportar els àudios per sentir-los sense connexió.
Aquest servei TTS presumeix de veus naturals en més de 29 idiomes. Cal comprar les veus premium a part. Hi ha paquets disponibles, però més varietat implica adquirir cada veu per separat.
Read Aloud
Read Aloud és un lector TTS de codi obert que només existeix com a extensió de Google Chrome. Permet llegir qualsevol web amb un sol clic i funciona arreu, també en llocs de notícies i materials de cursos universitaris.
A més d'oferir diversos continguts, Read Aloud disposa de múltiples veus ajustables. La veu principal la proporciona Chrome. Altres veus provenen de Microsoft i Amazon Polly. Tingues en compte que algunes requereixen compres addicionals.
Prova Speechify gratis avui mateix
Triar un bon programari TTS pot millorar o empitjorar l'experiència de lectura. Tot i que eSpeak és gratis i fàcil d'usar, té mancances que el fan poc recomanable a llarg termini.
Per característiques, Speechify destaca com la millor alternativa a eSpeak. El pots provar gratis aquí i comprovar com millora la teva lectura.
Preguntes freqüents
Quin és el motor de text a veu més realista?
Speechify és el motor de text a veu més realista perquè utilitza veus artificials de so humà en diverses aplicacions.
Quina és la millor app gratuïta de text a veu?
Per funcions, qualitat de veus i disponibilitat, Speechify és una de les millors apps TTS. Descarrega-la gratuïtament i prova funcions que milloren l'experiència de lectura i escolta.
eSpeak està disponible a Linux?
eSpeak està disponible a Linux com a programa de línia d'ordres per llegir textos de fitxers o fluxos d'entrada.
Es poden obtenir veus naturals de text a veu?
La intel·ligència artificial i el deep learning poden crear veus molt naturals que poden llegir documents de gairebé qualsevol format en veu alta.

