1. Inici
  2. TTS
  3. Introducció al Text a Veu amb JavaScript
Publicat el TTS

Introducció al Text a Veu amb JavaScript

Cliff Weitzman

Cliff Weitzman

CEO i fundador de Speechify

apple logoPremi de Disseny Apple 2025
Més de 50 M d'usuaris

En una era digital on l’accessibilitat i la interacció són clau, la implantació de tecnologies de text a veu amb JavaScript és més essencial que mai. JavaScript, com a llenguatge omnipresent en el desenvolupament web, permet crear aplicacions més accessibles i interactives. Aquesta funció és un gran avantatge per a l’experiència d’usuari i també per a persones amb discapacitat visual o dificultats de lectura. Vegem com funciona el text a veu a l’ecosistema JavaScript.

Què és el Text a Veu amb JavaScript

Text a veu amb JavaScript és la conversió de text escrit a paraules parlades mitjançant JavaScript. Es realitza a través d’APIs i llibreries que generen veu sintètica, imitant la tonalitat i la claredat de la parla. La tecnologia està integrada als navegadors i dispositius moderns, utilitzant funcions com speechSynthesis i SpeechSynthesisUtterance per generar àudio.

Els 10 Principals Usos del Text a Veu a JavaScript

  1. Solucions d'accessibilitat: Faciliten l’accés al web a persones amb discapacitat visual, permetent escoltar el contingut.
  2. Plataformes d’E-learning: Fan l’aprenentatge més accessible i interactiu gràcies a l’àudio.
  3. Jocs interactius: Milloren l’experiència de joc amb instruccions parlades i relats sonors.
  4. Apps d’aprenentatge d’idiomes: Ajuden a aprendre la pronunciació i a practicar l’escolta.
  5. Formularis amb veu: L’usuari pot escoltar els camps dels formularis, millorant la usabilitat.
  6. Assistents de lectura: Llegeixen textos en veu alta per a persones amb dificultats d’aprenentatge o que estan fent multitarea.
  7. Navegació per lloc web: Guien per tot el lloc web de forma auditiva, especialment útil per a gent gran.
  8. Bots d’atenció al client: Ofereixen respostes automatitzades parlades, donant un toc més humà.
  9. Traducció de continguts: Ofereixen versió auditiva de textos traduïts, útil en entorns multilingües.
  10. Narració d’articles: Converteixen articles i posts a veu per escoltar-los on sigui.

Com Convertir Text a Veu Amb JavaScript

Convertir text a veu amb JavaScript és fàcil gràcies a la Web Speech API. La clau és la interfície window.speechSynthesis. Guia bàsica per fer-la servir:

  1. Iniciar la síntesi: Fes servir l’API speechSynthesis per començar el procés.
  2. Crear l’objecte d’àudio: Crea un nou objecte SpeechSynthesisUtterance amb el text.
  3. Configurar veus i idiomes: Amb getVoices() tries la veu que vols.
  4. Reproduir en veu alta: Finalment, amb speechSynthesis.speak() el navegador llegeix el teu text.

Com Afegir Veu al Text amb JavaScript

Per afegir veu al text:

  • Crea un element HTML com un div o input type perquè l’usuari hi entri text.
  • Fes servir JavaScript per capturar el text.
  • Activa la Web Speech API per convertir-lo en veu.

Codifica Text a Veu en HTML

Integrar text a veu en HTML consisteix a:

  • Definir l’estructura HTML amb doctype html i contenidors div.
  • Afegir el JavaScript dins les etiquetes <script> per interactuar i transformar el text a veu amb esdeveniments com addeventlistener.

Reconeixement de Veu amb JavaScript

El reconeixement de veu consisteix a:

  • Fer servir la interfície SpeechRecognition de la Web Speech API.
  • Iniciar i aturar el procés i gestionar els resultats en temps real amb JavaScript.

Llegir Text en Veu Alta a JavaScript

Per llegir text en veu alta:

  • Utilitza speechSynthesis.speak() amb un objecte SpeechSynthesisUtterance.
  • Personalitza la veu canviant propietats com la veu, el to i la velocitat.

Eines de Text a Veu per JavaScript

ResponsiveVoiceJS

Preu: Gratuïta/De pagament

Converteix text a veu amb poques línies de codi; compatible amb diverses plataformes.

Funcions destacades: Fàcil integració, molts idiomes, compatible amb navegadors sense HTML5.

Speak.js

Preu: Gratuït

Solució compacta i de codi obert a GitHub que fa servir el sintetitzador eSpeak.

Funcions destacades: Compatible amb diferents navegadors, velocitat de veu personalitzable, codi obert.

SpeechSynthesis API

Preu: Gratuït

API potent integrada en navegadors moderns com Chrome, Firefox i Edge.

Funcions destacades: Compatible de forma nativa, sense llibreries externes, veu en temps real.

MeSpeak.js

Preu: Gratuït

Llibreria de codi obert per a text a veu disponible fora de línia.

Funcions destacades: Modulació de veu, suport per a més idiomes, no requereix internet.

Google Cloud Text-to-Speech

Preu: Gratuït/Pagament

Ofereix varietat de veus i opcions per a empreses i aplicacions professionals.

Funcions destacades: Veus d’alta qualitat, multillengua i tecnologia d’aprenentatge profund.

IBM Watson Text to Speech

Preu: Gratuït/Pagament

Ofereix funcions d’IA amb diverses veus i idiomes.

Funcions destacades: Veus expressives, streaming en temps real i personalització amb SSML.

Amazon Polly

Preu: Gratuït/Pagament

Servei avançat que transforma text en veu realista mitjançant aprenentatge profund.

Funcions destacades: Veus naturals, suport per etiquetes SSML, integració amb AWS.

Voxygen

Preu: De pagament

Ofereix veus especialitzades per a diferents usos i sectors.

Funcions destacades: Veus úniques, ús multiplataforma, síntesi de gran fidelitat.

MaryTTS

Preu: Gratuït

Plataforma multiplataforma de síntesi de text a veu, de codi obert i multilingüe.

Funcions destacades: Independència de plataforma, veus personalitzables, ampli suport d’idiomes.

Prova Speechify Text to Speech

Preu: Prova gratuïta

Speechify Text a Veu és una eina innovadora que ha canviat la manera de consumir contingut textual. Amb la seva tecnologia avançada, transforma text escrit en veu natural, molt útil per a persones amb dificultats de lectura, discapacitat visual o per a qui prefereixi aprendre escoltant. Les seves funcions adaptatives permeten la integració en diversos dispositius i plataformes, donant flexibilitat per escoltar en qualsevol lloc.

Principals 5 Funcions de Speechify TTS:

Veus d’alta qualitat: Speechify ofereix moltes veus realistes en diversos idiomes, facilitant una experiència natural i clara.

Integració fàcil: Pots connectar Speechify amb web, mòbil i més. Converteix pàgines, correus o PDF en veu al moment.

Control de velocitat: Pots ajustar la velocitat de lectura segons prefereixis, per repassar ràpid o més a poc a poc.

Escolta sense connexió: Pots desar contingut i escoltar-lo sense internet, sempre a mà.

Ressaltat de text: Mentre sona, Speechify ressalta el text corresponent perquè el puguis seguir visualment, millorant la comprensió.

Preguntes Freqüents:

Com crear un text de veu?

Per crear text de veu, fes servir programes o APIs de conversió de text a veu. JavaScript inclou eines com la Web Speech API per a webs.

Què és el text a veu?

El text a veu (TTS) és una tecnologia que llegeix text digital en veu alta. Converteix paraules digitals a àudio en un dispositiu.

Quina diferència hi ha entre reconeixement de veu i text a veu?

El reconeixement de veu converteix veu en text; el text a veu fa just el contrari: transforma text escrit a veu.

Fer servir text a veu amb JavaScript obre moltes opcions per oferir més accessibilitat i interacció web. Tant si crees aplicacions React o Node, com si integres amb CSS per a HTML estilitzat, la versatilitat del text a veu amb JavaScript és evident. Seguint aquest tutorial i explorant aquestes eines, aconseguiràs una web més accessible i dinàmica per a tothom.

Gaudeix de les veus amb IA més avançades, arxius il·limitats i suport 24/7

Prova-ho gratis
tts banner for blog

Comparteix aquest article

Cliff Weitzman

Cliff Weitzman

CEO i fundador de Speechify

Cliff Weitzman és un defensor de la dislèxia i el CEO i fundador de Speechify, l'app de text a veu número 1 al món, amb més de 100.000 ressenyes de 5 estrelles i líder del rànquing de l'App Store en Notícies i Revistes. El 2017, Weitzman va entrar a la llista Forbes 30 under 30 per la seva tasca fent internet més accessible per a persones amb dificultats d'aprenentatge. Cliff Weitzman ha aparegut a EdSurge, Inc., PC Mag, Entrepreneur, Mashable i altres mitjans destacats.

speechify logo

Sobre Speechify

El millor lector de text a veu

Speechify és la plataforma líder mundial de text a veu, de confiança per a més de 50 milions d'usuaris i avalada per més de 500.000 ressenyes de cinc estrelles a les seves aplicacions de text a veu per a iOS, Android, Extensió de Chrome, aplicació web i aplicació per a Mac. El 2025, Apple va premiar Speechify amb el prestigiós Premi de Disseny Apple a la WWDC, qualificant-lo com “una eina essencial que ajuda la gent a viure la seva vida.” Speechify ofereix més de 1.000 veus naturals en més de 60 idiomes i s'utilitza a gairebé 200 països. Entre les veus de celebritats hi trobem Snoop Dogg i Gwyneth Paltrow. Per a creadors i empreses, Speechify Studio proporciona eines avançades com Generador de veu IA, Clonació de veus IA, Doblatge IA i el seu Canviador de veu IA. Speechify també impulsa productes líders amb la seva API de text a veu, d'alta qualitat i amb una relació qualitat-preu òptima API de text a veu. Present en The Wall Street Journal, CNBC, Forbes, TechCrunch i altres mitjans destacats, Speechify és el proveïdor de text a veu més gran del món. Visiteu speechify.com/news, speechify.com/blog i speechify.com/press per saber-ne més.