1. Inici
  2. TTS
  3. Text a veu en HTML5: millora la interacció web amb la veu
Publicat el TTS

Text a veu en HTML5: millora la interacció web amb la veu

Cliff Weitzman

Cliff Weitzman

CEO i fundador de Speechify

apple logoPremi de Disseny Apple 2025
Més de 50 M d'usuaris

La tecnologia de text a veu (TTS) ha transformat la manera com interactuem amb els continguts web. HTML5 permet als desenvolupadors integrar-hi TTS, millorant l’accessibilitat i l’experiència d’usuari.

Què és el text a veu?

El text a veu converteix text escrit en paraules parlades. Aquesta tecnologia s’utilitza per ajudar persones amb discapacitat visual o dificultats de lectura.

El nucli del TTS en HTML5: la interfície SpeechSynthesis

La interfície SpeechSynthesis d’HTML5 forma part del Web Speech API i permet als desenvolupadors incorporar veu a les aplicacions web.

Ús de la interfície SpeechSynthesis

Per fer servir SpeechSynthesis a HTML5, cal JavaScript. L’objecte new SpeechSynthesisUtterance permet personalitzar la sortida de veu: to, velocitat i volum.

## Implementació del TTS en HTML5: guia pas a pas

Crear una pàgina web amb TTS implica diferents passos:

1. Configurar l’estructura HTML: Comença amb un fitxer HTML bàsic. Inclou elements com textarea per al text i div per a la sortida.

2. Incorporar CSS: Dona estil als elements amb CSS, utilitzant classes i connectant fulls d’estil externs mitjançant link rel i href.

3. JavaScript: Implementa el TTS amb JavaScript. Defineix variables amb const, obtén veus amb getVoices i configura esdeveniments.

Funcionalitats avançades i personalització

Selecció de diferents veus

Explora les diferents veus disponibles, idiomes i accents. Usa select voice i forEach per recórrer speechSynthesis.getVoices().

Disseny web responsiu

Assegura’t que la teva app TTS sigui responsiva. Utilitza CSS i media queries per adaptar-la a dispositius com mòbils Android i iOS.

Aplicacions i usos reals

El text a veu en HTML5 té nombroses aplicacions pràctiques:

- Eines educatives: El TTS pot ajudar en l’aprenentatge d’idiomes i donar suport a persones amb dificultats de lectura.

- Accessibilitat: És clau per fer webs accessibles a persones amb discapacitat visual.

- Aplicacions web interactives: Millora la interacció amb veu a les aplicacions web.

Allotjament i compartició del teu projecte TTS

Un cop tinguis el projecte enllestit, allotja’l en plataformes com GitHub per compartir-lo i col·laborar amb altres persones.

Conclusió: el futur del TTS en el desenvolupament web

El text a veu en HTML5 és un camp en creixement amb moltes possibilitats. Navegadors com Chrome i Firefox ajudaran a fer la web més accessible i interactiva per a tothom.

Speechify Text to Speech

Cost: Gratuït per provar

Speechify Text to Speech és una eina innovadora que ha canviat la manera com consumim textos. Gràcies a la seva tecnologia avançada de text a veu, converteix el text en veu realista, molt útil per a persones amb dificultats lectores, discapacitat visual o que prefereixin aprendre escoltant. La seva adaptabilitat permet usar-la en molts dispositius i plataformes, oferint flexibilitat per escoltar quan vulguis.

Top 5 funcionalitats de Speechify TTS:

Veus d’alta qualitat: Speechify ofereix moltes veus realistes en diversos idiomes, per a una experiència natural i fàcil d’entendre per a l’usuari.

Integració fàcil: Speechify es pot integrar en molts dispositius i plataformes, com navegadors web i smartphones. Pots convertir text de webs, correus, PDFs i altres suports a veu ràpidament.

Control de velocitat: L’usuari pot ajustar la velocitat de reproducció per sentir la lectura més ràpida o més lenta segons li convingui.

Escolta sense connexió: Pots desar-hi textos convertits i escoltar-los sense internet; no perdràs l’accés al contingut.

Ressaltat de text: Mentre escoltes, Speechify ressalta la secció llegida, de manera que la puguis seguir visualment i millorar la comprensió i la retenció.

Preguntes freqüents sobre text a veu en HTML

P: Com es codifica text a veu en HTML?

R: Per fer text a veu en HTML, utilitza la interfície SpeechSynthesis del Web Speech API. Crea un SpeechSynthesisUtterance en JavaScript, configura el contingut i fes servir speechSynthesis.speak() per iniciar la veu. Inclou un textarea per a l’entrada i interactua-hi amb JavaScript.

P: Com s’afegeix veu al text en HTML?

R: Per afegir veu a text en HTML, utilitza la interfície SpeechSynthesis amb JavaScript. Crea un SpeechSynthesisUtterance, estableix la propietat text i usa speechSynthesis.speak() per escoltar-la. Utilitza CSS per a l’estil i getVoices() per triar veus.

P: Com faig servir text a veu al meu navegador?

R: Cal que el teu navegador admeti el Web Speech API (p. ex. Chrome o Firefox). Crea una web amb HTML i JavaScript i utilitza window.speechSynthesis per accedir a la interfície de síntesi de veu.

P: Quin navegador té text a veu?

R: Chrome, Firefox i Safari admeten text a veu amb el Web Speech API. Cada navegador ofereix opcions diferents de veus i funcions.

P: Què és text a veu a text?

R: Normalment vol dir passar text a veu (TTS) i després, mitjançant reconeixement de veu, convertir l’àudio generat de nou a text.

P: Avantatges i inconvenients del text a veu?

R: Avantatges: més accessibilitat per a persones amb discapacitat, comoditat i millor aprenentatge. Inconvenients: manca de matís emocional i possibles errors de pronunciació.

P: Com s’inclou àudio amb text a veu?

R: Per incloure àudio amb text a veu, fes servir els elements d’àudio d’HTML5 conjuntament amb el TTS. Pots controlar la reproducció del TTS i dels fitxers d’àudio amb JavaScript.

P: Quina diferència hi ha entre text a veu i text a àudio?

R: El text a veu converteix text en veu en temps real per síntesi. El text a àudio sol ser la reproducció d’arxius d’àudio gravats prèviament.

P: Diferència entre veu i parla?

R: La parla és l’acte de parlar o el so que es produeix en parlar. La veu és el to i la qualitat sonora única d’una persona o la triada als sistemes TTS.

Gaudeix de les veus amb IA més avançades, arxius il·limitats i suport 24/7

Prova-ho gratis
tts banner for blog

Comparteix aquest article

Cliff Weitzman

Cliff Weitzman

CEO i fundador de Speechify

Cliff Weitzman és un defensor de la dislèxia i el CEO i fundador de Speechify, l'app de text a veu número 1 al món, amb més de 100.000 ressenyes de 5 estrelles i líder del rànquing de l'App Store en Notícies i Revistes. El 2017, Weitzman va entrar a la llista Forbes 30 under 30 per la seva tasca fent internet més accessible per a persones amb dificultats d'aprenentatge. Cliff Weitzman ha aparegut a EdSurge, Inc., PC Mag, Entrepreneur, Mashable i altres mitjans destacats.

speechify logo

Sobre Speechify

El millor lector de text a veu

Speechify és la plataforma líder mundial de text a veu, de confiança per a més de 50 milions d'usuaris i avalada per més de 500.000 ressenyes de cinc estrelles a les seves aplicacions de text a veu per a iOS, Android, Extensió de Chrome, aplicació web i aplicació per a Mac. El 2025, Apple va premiar Speechify amb el prestigiós Premi de Disseny Apple a la WWDC, qualificant-lo com “una eina essencial que ajuda la gent a viure la seva vida.” Speechify ofereix més de 1.000 veus naturals en més de 60 idiomes i s'utilitza a gairebé 200 països. Entre les veus de celebritats hi trobem Snoop Dogg i Gwyneth Paltrow. Per a creadors i empreses, Speechify Studio proporciona eines avançades com Generador de veu IA, Clonació de veus IA, Doblatge IA i el seu Canviador de veu IA. Speechify també impulsa productes líders amb la seva API de text a veu, d'alta qualitat i amb una relació qualitat-preu òptima API de text a veu. Present en The Wall Street Journal, CNBC, Forbes, TechCrunch i altres mitjans destacats, Speechify és el proveïdor de text a veu més gran del món. Visiteu speechify.com/news, speechify.com/blog i speechify.com/press per saber-ne més.