1. Inici
  2. TTS
  3. De text a veu als 90: Un viatge pel so i la tecnologia
Publicat el TTS

De text a veu als 90: Un viatge pel so i la tecnologia

Cliff Weitzman

Cliff Weitzman

CEO i fundador de Speechify

apple logoPremi de Disseny Apple 2025
Més de 50 M d'usuaris

La dècada dels 90 va ser crucial per al progrés de la tecnologia de text a veu (TTS), posant les bases dels sistemes sofisticats actuals. Aquesta tecnologia, dissenyada per convertir text escrit en paraula parlada, ha revolucionat com interactuem amb el contingut digital.

Inicis i evolució

A principis dels 90, les veus de text a veu eren molt més robòtiques i menys naturals que les d'avui. Tot i això, ja van ser pioneres i van servir de base per a la síntesi de veu i les eines de generador de veu que vindrien després. Windows, amb Microsoft al darrere, va ser dels primers a adoptar aquesta funcionalitat als seus sistemes operatius. Aquesta integració va fer la síntesi de veu més accessible, permetent aplicacions com la veu en off en vídeos i ajudant persones amb dificultats lectores.

Diversitat de llengües

Els 90 també van veure una gran expansió del suport de llengües per als sistemes TTS. Inicialment, la majoria de veus disponibles eren en anglès, però aviat s'hi van afegir idiomes com el japonès, l'anglès americà, l'espanyol, l'italià, el rus, el francès, l'alemany, el xinès i l'àrab. Aquesta ampliació va ser clau per crear un món digital més inclusiu, sobretot per als països no anglòfons.

Integració tecnològica i millora de qualitat

Amb els anys, la qualitat de les veus TTS va millorar molt. El pas de veus mecàniques i entrecortades a una parla més natural es va deure als avenços en intel·ligència artificial i algoritmes de veu. Empreses com Microsoft i, més tard, Apple i Amazon (amb Amazon Polly), van apostar fort pel desenvolupament de sistemes TTS d’alta qualitat basats en IA, creant veus com ‘Paul’ i ‘Tom’, molt més humanes.

Expansió de les aplicacions

La tecnologia TTS es va incorporar a molts àmbits nous als 90. Audiollibres, animacions, podcasts i videojocs van començar a fer servir TTS per a veus en off. La seva flexibilitat i l’estalvi de costos la van fer molt atractiva per als creadors de continguts. Tutorials educatius, tant a Windows com després a Android i iOS, van integrar TTS per oferir una experiència d'aprenentatge més interactiva.

APIs i moviments de codi obert

L’aparició d’APIs per a TTS va facilitar la integració de síntesi de veu en aplicacions. També va créixer el moviment de codi obert, cosa que va democratitzar la tecnologia TTS. Desenvolupadors d’arreu van poder contribuir-hi i aprofitar recursos i algoritmes compartits.

Veu femenina i inclusió multicultural

Als 90 va començar l’esforç per diversificar les veus TTS. La incorporació de veus femenines va ser un pas important, igual que la inclusió de diferents accents i dialectes, fent la tecnologia més representativa arreu del món.

Mirant cap al futur

Al final de la dècada, la tecnologia TTS ja estava a punt per fer el següent gran salt. Amb els fonaments posats als 90, els 2000 portarien una integració TTS encara més avançada en el dia a dia, amb generadors de veu amb IA més sofisticats.

Els anys 90 van ser decisius per al text a veu. Des de generadors bàsics fins a sistemes TTS naturals, d'alta qualitat i multilingües, la dècada va preparar el terreny per a les aplicacions de veu avançades que coneixem ara. Els fonaments d'aquells anys han estat crucials per a l’actual paisatge de tecnologia de veu i n’han marcat el futur.

Speechify Text to Speech

Cost: Prova gratuïta

Speechify Text to Speech és una eina innovadora que ha canviat la manera de consumir continguts textuals. Amb tecnologia avançada de text a veu, Speechify transforma text en paraula realista, molt útil per a persones amb dificultats lectores, problemes visuals o per a qui prefereix l’aprenentatge auditiu. Les seves capacitats adaptatives permeten una integració fluida amb molts dispositius i plataformes, donant flexibilitat per escoltar a qualsevol lloc.

5 millors funcions de Speechify TTS:

Veus d'alta qualitat: Speechify ofereix veus realistes i d'alta qualitat en diversos idiomes. Això garanteix una experiència d’escolta natural i fàcil d’entendre per als usuaris.

Integració sense fissures: Speechify s'integra amb diverses plataformes i dispositius: navegadors, mòbils, etc. Això facilita convertir en àudio qualsevol text, web, correu, PDF o font gairebé a l'instant.

Control de velocitat: Els usuaris poden ajustar la velocitat de lectura segons la seva preferència, per repassar ràpid o aprofundir-hi amb calma.

Escolta offline: Una funció clau de Speechify és poder desar text convertit i escoltar-lo sense connexió, garantint accés al contingut en qualsevol moment.

Ressaltar text: Mentre es va llegint el text, Speechify destaca la secció corresponent perquè l'usuari pugui seguir visualment el que s'està parlant. Aquesta entrada visual i auditiva pot millorar la comprensió i la retenció.

Preguntes freqüents

Quina va ser la primera veu de text a veu?

R: El primer sistema de text a veu (TTS) es va desenvolupar als anys 60 a Bell Labs. Aquest sistema, conegut com la veu 'Daisy', feia servir algoritmes bàsics de síntesi per convertir text en veu.

Quina és la veu de text a veu més realista?

Actualment, les veus TTS més realistes són generades per IA com Amazon Polly i WaveNet de Google. Aquests sistemes utilitzen algoritmes avançats per crear veus naturals i àudios de molta qualitat.

Quina veu TTS s'usa als memes?

R: Les veus TTS populars als memes sovint provenen de plataformes com Windows o iOS. El seu estil, a vegades humorístic i peculiar, com la 'David' o la 'Zira' de Microsoft, agrada molt als creadors de memes.

Quin text a veu va fer servir faith?

No s’especifica quina veu TTS va usar ‘Faith’. Tot i així, hi ha moltes veus TTS disponibles a Microsoft, Google o Apple, en anglès i altres idiomes per a diferents usos.

Q: Quina veu de text a veu sona com un robot?

Els primers sistemes TTS, com els dels 80 i 90, sonaven molt robòtics. Inclouen la cèlebre 'Microsoft Sam' de Windows, coneguda pel seu to mecànic tan característic.

Q: Quina és la veu de text a veu dels 90?

Als 90 destaquen veus com 'Microsoft Sam', 'Microsoft Mary' i 'Microsoft Mike', integrades a la síntesi de veu de Windows. Eren conegudes pel seu to robòtic i es van utilitzar molt en aplicacions, veus en off i tutorials.

Gaudeix de les veus amb IA més avançades, arxius il·limitats i suport 24/7

Prova-ho gratis
tts banner for blog

Comparteix aquest article

Cliff Weitzman

Cliff Weitzman

CEO i fundador de Speechify

Cliff Weitzman és un defensor de la dislèxia i el CEO i fundador de Speechify, l'app de text a veu número 1 al món, amb més de 100.000 ressenyes de 5 estrelles i líder del rànquing de l'App Store en Notícies i Revistes. El 2017, Weitzman va entrar a la llista Forbes 30 under 30 per la seva tasca fent internet més accessible per a persones amb dificultats d'aprenentatge. Cliff Weitzman ha aparegut a EdSurge, Inc., PC Mag, Entrepreneur, Mashable i altres mitjans destacats.

speechify logo

Sobre Speechify

El millor lector de text a veu

Speechify és la plataforma líder mundial de text a veu, de confiança per a més de 50 milions d'usuaris i avalada per més de 500.000 ressenyes de cinc estrelles a les seves aplicacions de text a veu per a iOS, Android, Extensió de Chrome, aplicació web i aplicació per a Mac. El 2025, Apple va premiar Speechify amb el prestigiós Premi de Disseny Apple a la WWDC, qualificant-lo com “una eina essencial que ajuda la gent a viure la seva vida.” Speechify ofereix més de 1.000 veus naturals en més de 60 idiomes i s'utilitza a gairebé 200 països. Entre les veus de celebritats hi trobem Snoop Dogg i Gwyneth Paltrow. Per a creadors i empreses, Speechify Studio proporciona eines avançades com Generador de veu IA, Clonació de veus IA, Doblatge IA i el seu Canviador de veu IA. Speechify també impulsa productes líders amb la seva API de text a veu, d'alta qualitat i amb una relació qualitat-preu òptima API de text a veu. Present en The Wall Street Journal, CNBC, Forbes, TechCrunch i altres mitjans destacats, Speechify és el proveïdor de text a veu més gran del món. Visiteu speechify.com/news, speechify.com/blog i speechify.com/press per saber-ne més.