1. Inici
  2. Windows
  3. Com utilitzar la síntesi de veu al PC
Publicat el Windows

Com utilitzar la síntesi de veu al PC

Tyler Weitzman

Tyler Weitzman

Màster en Informàtica per la Universitat de Stanford, defensor de la dislèxia i l’accessibilitat, CEO i fundador de Speechify

apple logoPremi de Disseny Apple 2025
Més de 50 M d'usuaris

Com utilitzar la síntesi de veu al PC

La síntesi de veu (o TTS) al PC pot millorar l'accessibilitat, permetre el multitasking i augmentar la productivitat. Hi ha moltes maneres diferents d'habilitar aquest programari al teu PC!

Síntesi de veu al PC

Fonaments bàsics de la síntesi de veu

La TTS té tres components clau: mòdul d'anàlisi de text, motor de síntesi i sistema d'àudio. L'anàlisi fragmenta el text en unitats petites, com paraules, frases o oracions, i té en compte puntuació i majúscules.

Aquesta anàlisi fa que la síntesi de veu, tant si és de Microsoft MS Sam TTS com d’un altre sistema, soni natural i coherent. El motor converteix aquestes unitats en sons fonètics estructurats.

El procés fa correspondre el text escrit als fonemes —els sons bàsics d’una llengua. Finalment, el sistema d'àudio utilitza tècniques de processament digital i mostres de veu humana gravada per generar el resultat.

La combinació d’anàlisi lingüística i processament d’àudio permet a la TTS generar una veu d’alta qualitat que s’assembla a la parla humana.

Com activar la síntesi de veu a Microsoft i Windows

Microsoft fa temps que treballa amb la síntesi de veu. De fet, Windows 2000 i XP ja incloïen programari TTS amb el sistema, conegut com a Microsoft Sam, que permetia usar la narració i altres funcions.

Com passa amb els primers projectes, Microsoft Sam era una mica rudimentari. Era evident que la veu era generada per IA i la qualitat de la síntesi de veu ha millorat molt des de llavors.

Microsoft ha fet molts canvis i millores a TTS. Windows Vista i Windows 7 incloïen Microsoft Anna i Windows 8 va introduir més opcions de veu. Avui dia, Windows 10 incorpora Hazel, David, George, Susan, Zira i Mark com a veus per defecte.

Per activar la síntesi de veu al teu PC, ves a Configuració, fes clic a Accessibilitat i cerca la secció Narrador. També pots prémer la combinació de tecles Windows + Ctrl + Intro per iniciar el Narrador.

Aquí també podràs personalitzar l'experiència, escollir diferents veus, ajustar la velocitat de lectura i molt més.

Beneficis d’utilitzar la síntesi de veu al PC

Fer servir la síntesi de veu pot ajudar a superar dificultats. Algunes persones tenen dificultats per llegir, com ara dislèxia, TDAH o altres discapacitats com ara baixa visió.

Amb una eina TTS no cal llegir pel teu compte, pots escoltar el text amb auriculars o altaveus com si fossin podcasts. Tot i així, encara que t’agradi la lectura tradicional, la TTS continua sent una bona opció.

Pots estalviar molt temps i fer més coses alhora escoltant el contingut amb TTS. També va bé per a e-learning o per gaudir de llibres mentre et relaxes.

Molta gent també tria la TTS per aprendre idiomes, perquè pot escoltar i llegir alhora. Així millora la pronunciació mentre segueix el text a la pantalla.

Com personalitzar la síntesi de veu al PC

A Configuració > Narrador trobaràs moltes opcions per personalitzar la lectura TTS. Podràs explorar veus diferents i altres funcions.

Hi ha força opcions de personalització per millorar la teva experiència, però només funcionen amb l’app Narrador inclosa a Windows 10 i 11.

Aquests sistemes operatius també admeten diversos idiomes, útils per a la funció TTS. L’app és de bona qualitat, però pot ser limitada per a algunes persones.

Si en vols més, cal descarregar alguna altra app. Hi ha alternatives de síntesi de veu molt potents i totalment compatibles amb Windows.

Utilitzant funcions de síntesi de veu al PC

Un cop tinguis activada la funció Text to Speech al PC, potser amb el millor programari de Windows per a TTS, explora totes les seves possibilitats i treu el màxim profit d’aquesta potent eina.

Comandes bàsiques de síntesi de veu

Fer servir la síntesi de veu és senzill. La majoria d’apps, incloent-hi les gratuïtes, permeten ressaltar el text i activar la funció amb una ordre o drecera.

El text seleccionat es converteix en veu i se sent pels altaveus o auriculars del PC. Amb l’arribada del reconeixement de veu, algunes apps permeten dictar el text a convertir.

Si estàs revisant un document llarg, en lloc de llegir tot el text pots seleccionar paràgrafs i deixar que la síntesi de veu, com l’opció de Microsoft, llegeixi per tu.

Estalvia temps i ajuda a detectar errors que potser se t'escaparien. Amb aplicacions gratuïtes, fins i tot pots enviar missatges sense teclejar.

Alguns programes inclouen un navegador o lector de documents, així pots llegir articles, PDFs o e-books directament dins l’app i millorar encara més l’experiència. Això permet escoltar blogs, notícies o llibres sencers sense forçar la vista.

Funcions avançades de síntesi de veu

La TTS sovint ofereix funcions avançades per millorar l’ús. Pots desar el text com a fitxer d’àudio per escoltar-lo offline, o escriure sense teclat amb la funció type and speak.

Si trobes un article interessant però no tens temps, desa’l com a àudio i escolta’l després mentre et mous. Així aprofites millor el temps i et mantens informat fins i tot quan no estàs al davant del PC.

Algunes apps, com computer text app o text pc software, permeten personalitzar com es pronuncien paraules concretes, així la lectura sona més real. És especialment útil amb termes tècnics, noms propis o paraules estrangeres.

Si estudies un idioma i dubtes de la pronunciació, pots fer servir TTS per escoltar-la. Això t’ajuda a millorar i a guanyar confiança parlant. I amb la funció de reconeixement de veu, fins i tot pots transcriure veu a text.

Com veus, la TTS ofereix moltes funcions que poden millorar l’experiència de lectura. Siguis estudiant, professional o lector ocasional, afegir la TTS a la teva rutina pot fer-te la vida més fàcil i agradable.

Amb opcions gratuïtes i apps de text des del PC, les possibilitats són infinites.

Solució de problemes comuns de TTS

Normalment, la TTS és fiable i fàcil d’usar, però de vegades pot donar problemes. Saber com solucionar-los t’ajudarà a tenir una bona experiència sense frustracions.

Solucionar problemes d’àudio

Si tens problemes amb el so de la TTS, primer revisa la configuració d’àudio del PC: volum, sortida seleccionada i drivers actualitzats. Si el problema continua, reinicia l’app TTS o l’ordinador.

Corregir errors de reconeixement de text

Els sistemes TTS depenen d’un bon reconeixement del text per oferir un so de qualitat. Això pot fallar amb textos complexos o mal formats.

Si la TTS interpreta malament paraules o frases, ajusta l’ortografia o el format. Algunes apps també permeten corregir manualment aquests errors perquè el contingut soni correcte.

Speechify — Alternativa a Narrador

Si vols més d’una app TTS, prova Speechify, una de les més populars avui. La seva API es va crear per ajudar gent amb dislèxia o dificultats lectores, però és útil per a tothom.

Speechify suporta més de catorze idiomes i té moltes veus IA i accents per a cada idioma. L’app és intuïtiva i fàcil, i té tutorials per treure-li tot el suc.

No caldrà dedicar gaire temps a entendre com funciona. Podràs començar a usar-la tan bon punt la descarreguis. L’app funciona a dispositius Windows, Android i Apple (iOS i MacOS).

El que fa de Speechify la millor app de TTS són les veus realistes: veus d’alta qualitat, que sonen molt humanes, i que pots personalitzar fàcilment al teu gust!

Speechify també ofereix OCR (reconeixement òptic de caràcters), així pot analitzar una foto i convertir el text a fitxer wav o mp3. La majoria d’apps només admeten Word o Google Docs, però Speechify llegeix gairebé qualsevol format.

Preguntes freqüents

Windows 10 té sintetitzador de veu?

Sí. Windows 10 inclou una eina de síntesi de veu gratuïta, el Narrador. Aquesta funció permet que el programa et llegeixi els fitxers i disposa de moltes opcions per personalitzar-la. Recomanem Speechify per obtenir millors funcions de TTS.

Com s’activa la síntesi de veu a l’ordinador?

Ves a Configuració i busca Accessibilitat. Fes-hi clic i veuràs el Narrador; només cal activar-lo amb el botó. Apareixerà una finestra amb més informació. 

Què és la síntesi de veu?

La síntesi de veu és un programari per convertir text en veu. Combina IA, deep learning, machine learning i altres tecnologies per oferir una veu realista.

El motor de veu permet transformar qualsevol format de text (incloent PDF i epub) en fitxers d'àudio. Aquestes apps milloren l'accessibilitat. Són populars Microsoft Azure, NaturalReader, Amazon Polly, Speechify, Balabolka i més.

Puc fer que l'ordinador em llegeixi textos?

Sí. Windows 10 i 11 inclouen l'eina Narrador de síntesi integrada. Si no t'agrada, pots descarregar una extensió de Chrome per usar-la a les webs (HTML), i una de les més populars és Speechify.

Gaudeix de les veus amb IA més avançades, arxius il·limitats i suport 24/7

Prova-ho gratis
tts banner for blog

Comparteix aquest article

Tyler Weitzman

Tyler Weitzman

Màster en Informàtica per la Universitat de Stanford, defensor de la dislèxia i l’accessibilitat, CEO i fundador de Speechify

Tyler Weitzman és el cofundador, cap d’Intel·ligència Artificial i president de Speechify, l’app número 1 de lectura de textos en veu alta al món, amb més de 100.000 ressenyes de 5 estrelles. Weitzman es va graduar a la Universitat de Stanford amb una llicenciatura en Matemàtiques i un màster en Informàtica amb especialització en Intel·ligència Artificial. Ha estat seleccionat per la revista Inc. com un dels 50 millors emprenedors i ha aparegut a Business Insider, TechCrunch, LifeHacker, CBS, entre d’altres mitjans. La seva recerca de màster es va centrar en IA i lectura de textos en veu alta, amb un treball final titulat: “CloneBot: Predicció personalitzada de respostes en diàleg.”

speechify logo

Sobre Speechify

El millor lector de text a veu

Speechify és la plataforma líder mundial de text a veu, de confiança per a més de 50 milions d'usuaris i avalada per més de 500.000 ressenyes de cinc estrelles a les seves aplicacions de text a veu per a iOS, Android, Extensió de Chrome, aplicació web i aplicació per a Mac. El 2025, Apple va premiar Speechify amb el prestigiós Premi de Disseny Apple a la WWDC, qualificant-lo com “una eina essencial que ajuda la gent a viure la seva vida.” Speechify ofereix més de 1.000 veus naturals en més de 60 idiomes i s'utilitza a gairebé 200 països. Entre les veus de celebritats hi trobem Snoop Dogg i Gwyneth Paltrow. Per a creadors i empreses, Speechify Studio proporciona eines avançades com Generador de veu IA, Clonació de veus IA, Doblatge IA i el seu Canviador de veu IA. Speechify també impulsa productes líders amb la seva API de text a veu, d'alta qualitat i amb una relació qualitat-preu òptima API de text a veu. Present en The Wall Street Journal, CNBC, Forbes, TechCrunch i altres mitjans destacats, Speechify és el proveïdor de text a veu més gran del món. Visiteu speechify.com/news, speechify.com/blog i speechify.com/press per saber-ne més.