El fundador de Speechify parla sobre el futur de la IA al podcast Everyday AI
Les veus de famosos són el futur de la IA generativa? És segura la IA? El fundador i CEO de Speechify, Cliff Weitzman, va conversar amb Jordan Wilson a l’episodi 152 del podcast Everyday AI per respondre aquestes i altres preguntes.
Podcast Everyday AI
El podcast Everyday AI és un popular programa diari, en directe i gratuït, i també un butlletí, que ajuda la gent a impulsar la seva carrera amb la IA. Manté els oients al dia amb consells i tendències clau de la IA generativa i els ensenya a treure’n profit per tenir èxit. Des del seu llançament, l’abril de 2023, el podcast Everyday AI ja té 22.000 oients i 7.800 subscriptors al butlletí diari, tots buscant eines per treballar de manera més intel·ligent i portar l’èxit a un altre nivell amb la IA.
La història de Speechify
Cliff Weitzman va crear Speechify després de patir dislèxia a la universitat i descobrir que la majoria de llibres no tenien audiollibre. Avui és la millor app de text a veu del món, amb més de 150.000 ressenyes de 5 estrelles i més de 25 milions d’usuaris. Com ha aconseguit que fins i tot Snoop Dogg col·labori amb l’empresa? Weitzman ho explica a l’episodi 152, emès dilluns 27 de novembre.
Com funciona Speechify
Weitzman va explicar que Speechify es basa en el millor motor de text a veu (TTS) amb el generador d’IA de veu més avançat per transformar text a veu, de manera instantània i assequible. Disponible a Android, Mac, iOS i web, i també com a extensions per Microsoft Edge i Google Chrome, Speechify no només llegeix text digital (PDFs, notícies, Google Docs, emails). Amb l’OCR avançat i IA, pots fotografiar llibres, apunts o documents i convertir-los en àudio realista en temps real.
Usos i objectiu de Speechify
Permet escoltar el text en comptes de llegir-lo o combinar-ho amb el ressaltat de lectura. Això facilita i accelera la comprensió. És una eina imprescindible per a estudiants i persones amb dificultats o discapacitats d’aprenentatge, com dislèxia, TDAH, baixa visió, ceguesa, autisme, lesions cerebrals i ansietat.
Als inicis, Speechify era sobretot una eina de suport per a persones amb diferències d’aprenentatge. Ara, segons Weitzman, la fan servir metges, advocats, comptables, militars, directius, professionals de finances, alumnes d’idiomes i persones que volen ser més productives o llegir més ràpid, gràcies a les veus naturals i l’OCR.
Weitzman afirma que l’objectiu de Speechify és “garantir que llegir no sigui una barrera per aprendre per a ningú, sigui quin sigui el teu origen”.
Veus de famosos
Amb el creixement de Speechify, han tingut l’oportunitat de col·laborar amb grans celebritats. A l’episodi, Weitzman i Wilson parlen de la col·laboració amb Snoop Dogg, que posa la seva veu a moltes de les opcions del sistema.
Weitzman explica que moltes col·laboracions de Speechify sorgeixen quan usuaris del producte contacten directament. L’agent de Snoop Dogg es va posar en contacte, volent ajudar el públic de Snoop a consumir informació a través de la seva veu. Això va portar Weitzman a gravar i replicar la veu de Snoop a l’estudi propi amb clonació de veu i tecnologia de síntesi.
Entre més de 200 veus IA de Speechify en diversos idiomes (anglès, xinès, espanyol, portuguès...), també hi ha l’actriu i inversora Gwyneth Paltrow com a narradora disponible per a text a veu.
Però aquestes veus de famosos, que poden llegir des de posts a xarxes socials fins a estudis, també tenen associades mesures de seguretat de Speechify per evitar mals usos.
Seguretat IA i clonació de veu
Tot i reconèixer els beneficis de la IA de text a veu i la clonació, Weitzman té molt present que un dels grans valors de Speechify és protegir creadors i persones, ja que “la seguretat d’IA és fonamental”.
Les polítiques de seguretat són clau, especialment ara que Speechify amplia funcions amb nous productes com Speechify Studio, un conjunt d’eines amb IA per crear veus IA, veus personalitzades, traduir, transcriure automàticament, editar vídeo i fer servir avatars d’IA.
Per exemple, Speechify només permet clonar la teva pròpia veu o la d’algú proper que hi dóna consentiment —no qualsevol veu d’internet— per evitar l’ús indegut i possibles suplantacions d’identitat o infraccions de drets d’autor.
“La nostra filosofia posa els propietaris dels drets al seient del conductor”, diu Weitzman. Remarca que la IA de Speechify no vol substituir els creadors de contingut, sinó “ampliar” la seva capacitat i ajudar-los a crear més i millor.
A més, Weitzman avança que Speechify treballa en un producte per saber fàcilment si una veu és humana o generada per IA i, si és sintètica, on s’ha creat. Això protegirà contra estafes en què, amb canvis de veu, es fan passar per familiars amb finalitats fraudulentes.
Escolta Cliff Weitzman al podcast Everyday AI
Per saber més sobre com la IA de text a veu de Speechify està modelant el futur de l’aprenentatge i la creació de contingut, escolta aquest episodi especial d’Everyday AI a plataformes com Apple Podcasts i Spotify o aquí mateix:
Minutatge del podcast:
[00:12:50] Seguretat en text a veu
[00:18:12] Usos de text a veu
[00:21:05] Preguntes de l’audiència
[00:24:10] Futur del text a veu
[00:27:28] La paraula escrita perd pes?
[00:31:30] Text a veu per a professionals

