IBM és sinònim d’ordinadors i tecnologia moderna. És una d’aquelles marques com Microsoft i Apple que tenim gravades a la ment. I amb raó. Produeixen alguns dels softwares més avançats i amb un munt de funcions útils per fer-nos la vida diària més fàcil.
Un d'aquests és IBM Watson. Una aplicació de text a veu basada en deep learning, preparada per convertir qualsevol text escrit en àudio d’alta qualitat amb moltes veus realistes. Tot seguit, t’expliquem tots els detalls per veure com es compara amb el seu preu.
Què és Watson text to speech?
En essència, Watson Text to Speech és una API al núvol que proporciona processament del llenguatge natural. Automatitza veus generades per IA que funcionen en diferents idiomes. Les veus sonen molt naturals, gairebé indistingibles de les humanes. És un software fantàstic, pràctic i que no requereix tutorials.
El pots fer servir com a assistent virtual per comunicar-te amb persones en el seu idioma o per eliminar temps d’espera en atenció al client. També millora l’accessibilitat per a persones amb dislèxia, TDAH o baixa visió. Però no ens avancem; en parlarem tot seguit.
Funcionalitats
Com totes les bones aplicacions, Watson text to speech ofereix molt als seus usuaris. No és només una eina bàsica de síntesi de veu en temps real. Pot fer molt més. Vegem-ne algunes de les característiques més destacades.
Idiomes
Watson Text to Speech admet més de 10 idiomes. Alguns són l’anglès, l’alemany, l’italià, el xinès, l’àrab i el portuguès. A més, pots importar text en un idioma i fer que el sistema el llegeixi en un altre. Ideal per a estudiants d’idiomes estrangers.
Opcions d’edició
Tot i que no és un programa d’edició, permet retocar alguns aspectes bàsics. Quan obres Watson text to speech, veus el quadre de diàleg on pots escriure o enganxar text. Després, tries l’idioma i el tipus de veu.
Pots escollir diferents dialectes i veus, a més de la velocitat i el to. Per exemple, l’anglès té accent americà, britànic i australià. No és res revolucionari, però és suficient per a un usuari mitjà.
Varietat de veus
Cada idioma té diverses veus. En anglès americà pots triar fins a 11 narradors d’IA, cadascun amb característiques pròpies. Alguns funcionen millor per a e-learning i d’altres, més alegres, són ideals per a vídeos de YouTube, per exemple.
Què el fa diferent?
Què fa IBM Watson diferent d’altres opcions TTS? A més del nom, ofereix veus d’IA molt realistes (neurals). També pots crear veus personalitzades, una opció ideal per a creadors de continguts.
Però no s’acaba aquí. Aquest assistent Watson ofereix més: pots definir la pronunciació de paraules, útil per aclarir mots poc habituals i donar als textos un to més professional.
També destaca per l’expressivitat a la narració. Cada veu pot tenir estil propi: GoodNews, Apology, Uncertainty. Si hi sumes el control del to, del volum i de la velocitat, és força complet.
Avantatges
I tot això porta a la pregunta clau: qui treu més profit d’IBM Watson text to speech? Doncs molta gent: des de petits negocis que volen millorar l’experiència d’usuari amb un xatbot, fins a creadors de vídeos per a xarxes o e-learning. Però, val la pena? Vegem-ho.
Preus
Tot i que no és codi obert, Watson té una versió gratuïta (Lite). Perfecta si no vols gastar diners ara mateix. Pots transcriure 10.000 caràcters/mes, amb 35 veus i triar entre 16 idiomes i dialectes.
També hi ha plans Standard, Premium i Deploy Anywhere. Els preus varien —cal consultar IBM. Inclouen transcripció il·limitada, 35 veus i tots els idiomes i dialectes. Només canvia la integració amb serveis com Google Cloud.
Speechify
A més de Watson, hi ha altres solucions TTS. Una de les més populars és Speechify, i val la pena provar-la. Es basa en models d’aprenentatge automàtic, IA i algoritmes OCR, cosa que et permet fer una foto d’un text i fer-lo llegir, a més de la transcripció bàsica.
Speechify té més de 30 veus d’IA en més de 15 idiomes. Està disponible per a iOS i Android, per a Mac i com a complemento per a Chrome i Safari. Prova-ho i converteix textos en àudio.
Preguntes freqüents
Pots usar IBM Watson text to speech comercialment?
L’acord SaaS amb IBM preveu l’ús personal de Watson TTS, però no comercial. Per exemple, no pots cobrar a altres persones per transcriure’ls el text amb la teva llicència.
Com puc descarregar l’app Watson text to speech?
Primer, cal crear un compte IBM Cloud. Quan el tinguis, ves a la pàgina de descàrrega i tria la versió (x64 o x86) de Watson text to speech que correspongui al teu dispositiu.

