1. Inici
  2. TTS
  3. Text to Speech dels 80: Un viatge per la tecnologia de síntesi de veu
Publicat el TTS

Text to Speech dels 80: Un viatge per la tecnologia de síntesi de veu

Cliff Weitzman

Cliff Weitzman

CEO i fundador de Speechify

apple logoPremi de Disseny Apple 2025
Més de 50 M d'usuaris

Introducció: L’alba de la síntesi de veu

Als anys 80, el món del text a veu (TTS) va viure innovacions remarcables. Aquella dècada va marcar l’inici de la síntesi de veu moderna, transformant la interacció entre ordinadors i usuaris.

Tecnologia pionera: SAM i Votrax

Un dels programes de text a veu més icònics d'aquella època fou el SAM (Software Automatic Mouth), un programari innovador per a sistemes Commodore, Apple i Atari. SAM feia servir fonemes i algorismes per generar veu sintètica, tota una novetat aleshores. Paral·lelament, Votrax, un maquinari sintetitzador de veu, va tenir un gran impacte en videojocs i ordinadors com l’IBM.

L’evolució del TTS als sistemes operatius

En aquells anys, gegants com Microsoft, Apple i IBM van començar a integrar la síntesi de veu en els seus sistemes operatius, facilitant l’accés i la difusió de la tecnologia TTS.

Fonètica i algorismes fonètics: El cor del TTS

Entendre la fonètica va ser clau per desenvolupar el TTS. Els primers sistemes de veu utilitzaven algorismes fonètics per convertir text en veu, inicialment en anglès, però posteriorment també en idiomes com l’espanyol, el japonès, el rus o l’italià.

Programari de text a veu: Del Commodore al Mac i més enllà

Els 80 van veure l’evolució del TTS: de veus sintètiques bàsiques en sistemes com Commodore i Mac a tecnologies de veu superposada en PCs i els primers dispositius Android.

Síntesi de veu en l’entreteniment i l’educació

La tecnologia TTS es va integrar en videojocs, audiollibres i programari educatiu, obrint noves formes d’interacció i d’accessibilitat.

L’impacte del TTS en l’accessibilitat

Per a moltes persones amb discapacitat, el TTS va suposar un canvi radical, permetent un millor accés als continguts digitals mitjançant la síntesi i la reproducció de veu.

Arxius d’àudio d’alta qualitat i reproducció en temps real

Els avenços en arxius d’àudio d’alta qualitat i en reproducció en temps real van millorar molt l’experiència, fent el TTS més natural i fàcil de fer servir.

APIs i complements: Expandint l’abast del TTS

El desenvolupament d’APIs i complements va permetre integrar el TTS en moltes aplicacions, impulsant-ne encara més l’ús.

TTS a l’era moderna: Veus amb IA i més

Ja al segle XXI, les tecnologies de veu amb IA i nous algorismes han evolucionat notablement, definint el futur de la síntesi de veu.

Tutorials i recursos per a apassionats del TTS

Per als interessats en la part tècnica, recursos com GitHub ofereixen tutorials, emuladors i programes de síntesi de veu per aprendre i experimentar pel vostre compte.

El llegat del TTS dels 80

Els anys 80 van establir les bases dels sistemes avançats de text a veu. De DECTalk a la síntesi moderna amb IA, la història del TTS reflecteix de prop l’evolució tecnològica.

Referències

  • Articles de la Viquipèdia sobre història i tecnologia de text a veu.
  • Tutorials i emuladors disponibles a GitHub.
  • Articles i documentació sobre solucions TTS inicials com SAM i Votrax.

Speechify Text to Speech

Cost: Prova gratuïta

Speechify Text to Speech és una eina revolucionària que ha canviat la manera de consumir textos. Amb la seva tecnologia TTS avançada, converteix text en paraules parlades realistes i ajuda persones amb dificultats de lectura, baixa visió o que prefereixen aprendre escoltant. S’adapta fàcilment a tota mena de dispositius i plataformes, i permet escoltar contingut des de qualsevol lloc.

Top 5 funcions de Speechify TTS:

Veus d’alta qualitat: Speechify ofereix una àmplia varietat de veus reals i d’alta qualitat en molts idiomes, amb una experiència natural que facilita l’escolta i la comprensió.

Integració perfecta: Speechify s’integra amb moltes plataformes i dispositius, incloent-hi navegadors web, mòbils i més. Permet convertir al moment text de webs, correus, PDFs i altres formats a veu.

Control de velocitat: Els usuaris poden ajustar la velocitat de lectura al seu gust, tant per repassar ràpidament com per aprofundir-hi a poc a poc.

Escolta sense connexió: Una funció clau de Speechify és guardar i escoltar text convertit sense connexió a Internet, assegurant-hi accés continu.

Ressaltat de text: Mentre l’aplicació llegeix, Speechify ressalta el fragment corresponent, permetent seguir el text visualment. Això n’afavoreix la comprensió i la retenció.

Preguntes freqüents: Tecnologia de text a veu

Quin és el programa més antic de text a veu?

El programa de text a veu més antic conegut és el sintetitzador de veu Votrax, un dispositiu pioner en la tecnologia de síntesi de veu.

Què és el programa SAM de text a veu?

SAM (Software Automatic Mouth) és un programa TTS desenvolupat per a Commodore, Atari i els primers Mac, conegut per l’ús de fonemes i algorismes propis.

Quina veu de text a veu és la més realista?

Les veus TTS més realistes solen provenir de sistemes de veu amb IA que fan servir algorismes avançats per aconseguir una síntesi natural i de qualitat.

Quina veu de text a veu utilitza Bonzibuddy?

Bonzibuddy, assistent digital, utilitzava el sistema de text a veu de Microsoft per a la funció de veu, aprofitant la síntesi incorporada a Windows.

Quin programa de text a veu pot llegir qualsevol document?

Molts programes TTS actuals, de Microsoft, Apple o tercers, poden llegir pràcticament qualsevol document i estan disponibles en diversos idiomes, com l’anglès, l’espanyol o el japonès.

Quines són les dues veus TTS més utilitzades?

Les dues veus TTS més utilitzades solen ser les veus predeterminades en anglès dels principals sistemes operatius, com Cortana de Microsoft i Siri d’Apple.

Quina veu TTS utilitza Siri?

La veu de Siri, l’assistent virtual d’Apple, fa servir una veu TTS pròpia d’Apple, coneguda per la seva qualitat natural i la reproducció en temps real.

Quin programa TTS fa servir Siri?

Siri utilitza un programa TTS propietari d’Apple, integrat a iOS i macOS, basat en tecnologia avançada de síntesi de veu.

Gaudeix de les veus amb IA més avançades, arxius il·limitats i suport 24/7

Prova-ho gratis
tts banner for blog

Comparteix aquest article

Cliff Weitzman

Cliff Weitzman

CEO i fundador de Speechify

Cliff Weitzman és un defensor de la dislèxia i el CEO i fundador de Speechify, l'app de text a veu número 1 al món, amb més de 100.000 ressenyes de 5 estrelles i líder del rànquing de l'App Store en Notícies i Revistes. El 2017, Weitzman va entrar a la llista Forbes 30 under 30 per la seva tasca fent internet més accessible per a persones amb dificultats d'aprenentatge. Cliff Weitzman ha aparegut a EdSurge, Inc., PC Mag, Entrepreneur, Mashable i altres mitjans destacats.

speechify logo

Sobre Speechify

El millor lector de text a veu

Speechify és la plataforma líder mundial de text a veu, de confiança per a més de 50 milions d'usuaris i avalada per més de 500.000 ressenyes de cinc estrelles a les seves aplicacions de text a veu per a iOS, Android, Extensió de Chrome, aplicació web i aplicació per a Mac. El 2025, Apple va premiar Speechify amb el prestigiós Premi de Disseny Apple a la WWDC, qualificant-lo com “una eina essencial que ajuda la gent a viure la seva vida.” Speechify ofereix més de 1.000 veus naturals en més de 60 idiomes i s'utilitza a gairebé 200 països. Entre les veus de celebritats hi trobem Snoop Dogg i Gwyneth Paltrow. Per a creadors i empreses, Speechify Studio proporciona eines avançades com Generador de veu IA, Clonació de veus IA, Doblatge IA i el seu Canviador de veu IA. Speechify també impulsa productes líders amb la seva API de text a veu, d'alta qualitat i amb una relació qualitat-preu òptima API de text a veu. Present en The Wall Street Journal, CNBC, Forbes, TechCrunch i altres mitjans destacats, Speechify és el proveïdor de text a veu més gran del món. Visiteu speechify.com/news, speechify.com/blog i speechify.com/press per saber-ne més.