1. Inici
  2. API
  3. Text to Speech Python: guia completa
Publicat el API

Text to Speech Python: guia completa

Cliff Weitzman

Cliff Weitzman

CEO i fundador de Speechify

L'API de Speechify ofereix una latència de 300 ms, veus amb qualitat humana i més de 50 idiomes

apple logoPremi de Disseny Apple 2025
Més de 50 M d'usuaris

Benvingut al món apassionant del text a veu (TTS) en Python! Aquesta guia completa t'ajudarà a entendre tot el que cal per convertir textos en veu amb Python. Tant si ets principiant com si ets un desenvolupador experimentat, hi trobaràs consells útils, exemples pràctics i casos d'ús reals.

Què és el text a veu?

La tecnologia de text a veu (TTS) converteix text escrit en paraules parlades. Amb diferents algoritmes i biblioteques Python, aquesta tecnologia ara és accessible i molt versàtil.

Primer pas amb Python TTS

Primer, assegura't de tenir Python instal·lat. Es recomana Python 3 per les seves funcionalitats actualitzades. El pots descarregar des del web oficial per a Windows, Linux o altres sistemes operatius.

Configura el teu entorn

  • Instal·la Python i configura l'entorn.
  • Tria un IDE o editor de text com Visual Studio Code o PyCharm.

Biblioteques de Python per a text a veu

Python ofereix diverses biblioteques TTS amb funcions i característiques diferents.

pyttsx3: biblioteca multiplataforma

  • pyttsx3 és una biblioteca Python que funciona sense connexió i admet diverses veus i idiomes com anglès, francès, alemany i hindi.
  • Instal·lació: pip install pyttsx3

Ús bàsic:

```python

import pyttsx3

engine = pyttsx3.init()

engine.say("Hello World")

engine.runAndWait()

```

gTTS: Google Text to Speech

  • gTTS (Google Text to Speech) és una biblioteca Python que converteix text en veu amb l'API TTS de Google.
  • Requereix connexió a Internet i suporta molts idiomes i dialectes.
  • Instal·lació: pip install gTTS

Ús bàsic:

```python

from gtts import gTTS

tts = gTTS('hello', lang='en')

tts.save('hello.mp3')

```

Funcions TTS avançades a Python

Les biblioteques TTS de Python ofereixen funcions avançades per a necessitats més sofisticades.

Integració amb reconeixement de veu

  • Combina TTS i reconeixement de veu per crear apps interactives.
  • La biblioteca speech_recognition de Python es pot fer servir amb TTS per oferir una experiència d'àudio completa.

Personalitzar la veu

  • Ajusta la velocitat, el volum i la veu amb pyttsx3.
  • Per exemple, canvia la veu o la velocitat.

Desa la veu a fitxers d'àudio

Desa l'àudio com a MP3 o altres formats per escoltar-lo més endavant.

Aplicacions reals del TTS en Python

El TTS de Python no és només per aprendre: té aplicacions pràctiques en molts àmbits.

Programari educatiu

  • Tecnologia d'assistència per a estudiants amb discapacitat visual.
  • Aplicacions per aprendre idiomes.

Automatització i notificacions

  • Respostes automàtiques per veu en serveis d'atenció al client.
  • Notificacions i alertes en programes informàtics.

Aquesta guia et dóna una base sòlida sobre el text a veu a Python. Per aprofundir-hi, consulta recursos i tutorials addicionals a GitHub o webs d'aprenentatge de Python. Recorda: la pràctica fa l'expert, així que posa't mans a l'obra i crea avui el teu propi projecte amb Python!

Prova Speechify Text to Speech

Cost: Prova gratuïta

Speechify Text to Speech és una eina innovadora que ha revolucionat la manera de consumir contingut. Amb tecnologia TTS avançada, Speechify converteix text en veu natural, ideal per a persones amb dificultats lectores, discapacitat visual o que prefereixin aprendre escoltant. S'adapta a molts dispositius i plataformes i permet escoltar el text arreu.

Les 5 millors funcions de Speechify TTS:

Veus d'alta qualitat: Speechify ofereix veus variades, de qualitat i molt realistes en molts idiomes. Això permet una experiència natural, fàcil d'entendre i que ajuda a seguir el contingut.

Integració fluida: Speechify es pot integrar en moltes plataformes i dispositius, des de navegadors web fins a mòbils, i permet convertir qualsevol text (webs, correus, PDFs, etc.) en veu gairebé de seguida.

Control de velocitat: Pots ajustar la velocitat de reproducció, per seguir el contingut ràpidament o escoltar-lo amb més calma.

Escolta sense internet: Una gran funció de Speechify és poder desar i escoltar el text convertit sense connexió, mantenint-hi l'accés encara que no tinguis internet.

Ressaltat de text: Speechify ressalta el fragment de text mentre sona, i fa molt fàcil seguir el que s'està llegint. Aquesta ajuda visual i auditiva millora la comprensió i la retenció.

PMF text a veu Python

Quina biblioteca gratuïta de text a veu hi ha a Python?

pyttsx3 i gTTS (Google Text to Speech) són biblioteques gratuïtes i populars de text a veu per a Python. pyttsx3 funciona offline a Windows, Linux, etc. gTTS necessita Internet.

gTTS requereix Internet?

Sí, gTTS (Google Text to Speech) necessita Internet perquè utilitza l'API de Google per convertir text en veu.

gTTS de Google és una biblioteca Python?

Sí, gTTS és una biblioteca Python que fa servir els serveis de text a veu de Google per convertir text en veu en programes Python.

pyttsx3 és segura?

Sí, pyttsx3 es considera segura i és molt utilitzada per convertir text a veu en Python, i està disponible a GitHub per transparència i suport de la comunitat.

Com es fa text a veu a Python?

Per convertir text a veu a Python, utilitza pyttsx3 o gTTS. Importa la biblioteca, inicialitza el motor i fes servir el mètode say per convertir text. Exemple:

```python

import pyttsx3

engine = pyttsx3.init()

engine.say("Your text here")

engine.runAndWait()

```

Què fa la síntesi de veu?

La síntesi de veu és la producció artificial de veu humana a partir de text. Transforma text en paraules, et permet controlar la veu, la velocitat i l'idioma, i s'utilitza sovint en sistemes TTS.

Quina és la millor biblioteca de text a veu a Python?

La "millor" biblioteca de text a veu en Python depèn del que necessitis. pyttsx3 és ideal per a ús offline i multiplataforma, amb idiomes variats com anglès, francès i hindi. gTTS destaca per la seva simplicitat i qualitat de veu (fa servir Google), però requereix Internet.

Accedeix ràpidament a les teves veus preferides de Speechify via API, escalable i fàcil per a desenvolupadors

Accedeix a l'API
api access banner

Comparteix aquest article

Cliff Weitzman

Cliff Weitzman

CEO i fundador de Speechify

Cliff Weitzman és un defensor de la dislèxia i el CEO i fundador de Speechify, l'app de text a veu número 1 al món, amb més de 100.000 ressenyes de 5 estrelles i líder del rànquing de l'App Store en Notícies i Revistes. El 2017, Weitzman va entrar a la llista Forbes 30 under 30 per la seva tasca fent internet més accessible per a persones amb dificultats d'aprenentatge. Cliff Weitzman ha aparegut a EdSurge, Inc., PC Mag, Entrepreneur, Mashable i altres mitjans destacats.

speechify logo

Sobre Speechify

El millor lector de text a veu

Speechify és la plataforma líder mundial de text a veu, de confiança per a més de 50 milions d'usuaris i avalada per més de 500.000 ressenyes de cinc estrelles a les seves aplicacions de text a veu per a iOS, Android, Extensió de Chrome, aplicació web i aplicació per a Mac. El 2025, Apple va premiar Speechify amb el prestigiós Premi de Disseny Apple a la WWDC, qualificant-lo com “una eina essencial que ajuda la gent a viure la seva vida.” Speechify ofereix més de 1.000 veus naturals en més de 60 idiomes i s'utilitza a gairebé 200 països. Entre les veus de celebritats hi trobem Snoop Dogg i Gwyneth Paltrow. Per a creadors i empreses, Speechify Studio proporciona eines avançades com Generador de veu IA, Clonació de veus IA, Doblatge IA i el seu Canviador de veu IA. Speechify també impulsa productes líders amb la seva API de text a veu, d'alta qualitat i amb una relació qualitat-preu òptima API de text a veu. Present en The Wall Street Journal, CNBC, Forbes, TechCrunch i altres mitjans destacats, Speechify és el proveïdor de text a veu més gran del món. Visiteu speechify.com/news, speechify.com/blog i speechify.com/press per saber-ne més.