El fundador de Speechify parla sobre el futur de la IA al podcast Everyday AI

Les veus de famosos són el futur de la IA generativa? És segura la IA? El fundador i CEO de Speechify, Cliff Weitzman, va conversar amb Jordan Wilson a l’episodi 152 del podcast Everyday AI per respondre aquestes i altres preguntes.

Podcast Everyday AI

El podcast Everyday AI és un popular programa diari, en directe i gratuït, i també un butlletí, que ajuda la gent a impulsar la seva carrera amb la IA. Manté els oients al dia amb consells i tendències clau de la IA generativa i els ensenya a treure’n profit per tenir èxit. Des del seu llançament, l’abril de 2023, el podcast Everyday AI ja té 22.000 oients i 7.800 subscriptors al butlletí diari, tots buscant eines per treballar de manera més intel·ligent i portar l’èxit a un altre nivell amb la IA.

La història de Speechify

Cliff Weitzman va crear Speechify després de patir dislèxia a la universitat i descobrir que la majoria de llibres no tenien audiollibre. Avui és la millor app de text a veu del món, amb més de 150.000 ressenyes de 5 estrelles i més de 25 milions d’usuaris. Com ha aconseguit que fins i tot Snoop Dogg col·labori amb l’empresa? Weitzman ho explica a l’episodi 152, emès dilluns 27 de novembre.

Com funciona Speechify

Weitzman va explicar que Speechify es basa en el millor motor de text a veu (TTS) amb el generador d’IA de veu més avançat per transformar text a veu, de manera instantània i assequible. Disponible a Android, Mac, iOS i web, i també com a extensions per Microsoft Edge i Google Chrome, Speechify no només llegeix text digital (PDFs, notícies, Google Docs, emails). Amb l’OCR avançat i IA, pots fotografiar llibres, apunts o documents i convertir-los en àudio realista en temps real.

Usos i objectiu de Speechify

Permet escoltar el text en comptes de llegir-lo o combinar-ho amb el ressaltat de lectura. Això facilita i accelera la comprensió. És una eina imprescindible per a estudiants i persones amb dificultats o discapacitats d’aprenentatge, com dislèxia, TDAH, baixa visió, ceguesa, autisme, lesions cerebrals i ansietat.

Als inicis, Speechify era sobretot una eina de suport per a persones amb diferències d’aprenentatge. Ara, segons Weitzman, la fan servir metges, advocats, comptables, militars, directius, professionals de finances, alumnes d’idiomes i persones que volen ser més productives o llegir més ràpid, gràcies a les veus naturals i l’OCR.

Weitzman afirma que l’objectiu de Speechify és “garantir que llegir no sigui una barrera per aprendre per a ningú, sigui quin sigui el teu origen”.

Veus de famosos

Amb el creixement de Speechify, han tingut l’oportunitat de col·laborar amb grans celebritats. A l’episodi, Weitzman i Wilson parlen de la col·laboració amb Snoop Dogg, que posa la seva veu a moltes de les opcions del sistema.

Weitzman explica que moltes col·laboracions de Speechify sorgeixen quan usuaris del producte contacten directament. L’agent de Snoop Dogg es va posar en contacte, volent ajudar el públic de Snoop a consumir informació a través de la seva veu. Això va portar Weitzman a gravar i replicar la veu de Snoop a l’estudi propi amb clonació de veu i tecnologia de síntesi.

Entre més de 200 veus IA de Speechify en diversos idiomes (anglès, xinès, espanyol, portuguès...), també hi ha l’actriu i inversora Gwyneth Paltrow com a narradora disponible per a text a veu.

Però aquestes veus de famosos, que poden llegir des de posts a xarxes socials fins a estudis, també tenen associades mesures de seguretat de Speechify per evitar mals usos.

Seguretat IA i clonació de veu

Tot i reconèixer els beneficis de la IA de text a veu i la clonació, Weitzman té molt present que un dels grans valors de Speechify és protegir creadors i persones, ja que “la seguretat d’IA és fonamental”.

Les polítiques de seguretat són clau, especialment ara que Speechify amplia funcions amb nous productes com Speechify Studio, un conjunt d’eines amb IA per crear veus IA, veus personalitzades, traduir, transcriure automàticament, editar vídeo i fer servir avatars d’IA.

Per exemple, Speechify només permet clonar la teva pròpia veu o la d’algú proper que hi dóna consentiment —no qualsevol veu d’internet— per evitar l’ús indegut i possibles suplantacions d’identitat o infraccions de drets d’autor.

“La nostra filosofia posa els propietaris dels drets al seient del conductor”, diu Weitzman. Remarca que la IA de Speechify no vol substituir els creadors de contingut, sinó “ampliar” la seva capacitat i ajudar-los a crear més i millor.

A més, Weitzman avança que Speechify treballa en un producte per saber fàcilment si una veu és humana o generada per IA i, si és sintètica, on s’ha creat. Això protegirà contra estafes en què, amb canvis de veu, es fan passar per familiars amb finalitats fraudulentes.

Escolta Cliff Weitzman al podcast Everyday AI

Per saber més sobre com la IA de text a veu de Speechify està modelant el futur de l’aprenentatge i la creació de contingut, escolta aquest episodi especial d’Everyday AI a plataformes com Apple Podcasts i Spotify o aquí mateix:

Minutatge del podcast:

[00:12:50] Seguretat en text a veu

[00:18:12] Usos de text a veu

[00:21:05] Preguntes de l’audiència

[00:24:10] Futur del text a veu

[00:27:28] La paraula escrita perd pes?

[00:31:30] Text a veu per a professionals

Speechify és la plataforma líder mundial de text a veu, de confiança per a més de 50 milions d'usuaris i avalada per més de 500.000 ressenyes de cinc estrelles a les seves aplicacions de text a veu per a iOS, Android, Extensió de Chrome, aplicació web i aplicació per a Mac. El 2025, Apple va premiar Speechify amb el prestigiós Premi de Disseny Apple a la WWDC, qualificant-lo com “una eina essencial que ajuda la gent a viure la seva vida.” Speechify ofereix més de 1.000 veus naturals en més de 60 idiomes i s'utilitza a gairebé 200 països. Entre les veus de celebritats hi trobem Snoop Dogg i Gwyneth Paltrow. Per a creadors i empreses, Speechify Studio proporciona eines avançades com Generador de veu IA, Clonació de veus IA, Doblatge IA i el seu Canviador de veu IA. Speechify també impulsa productes líders amb la seva API de text a veu, d'alta qualitat i amb una relació qualitat-preu òptima API de text a veu. Present en The Wall Street Journal, CNBC, Forbes, TechCrunch i altres mitjans destacats, Speechify és el proveïdor de text a veu més gran del món. Visiteu speechify.com/news, speechify.com/blog i speechify.com/press per saber-ne més.

El fundador de Speechify parla sobre el futur de la IA al podcast Everyday AI

Cliff Weitzman

Speechify, el teu assistent de veu amb IA.
Text a veu. Dictat per veu. Respostes ràpides.

El fundador de Speechify parla sobre el futur de la IA al podcast Everyday AI

Podcast Everyday AI