1. Inici
  2. Transcripció d’àudio i vídeo
  3. Opcions gratuïtes per transcriure àudio
Publicat el Transcripció d’àudio i vídeo

Opcions gratuïtes per transcriure àudio

Cliff Weitzman

Cliff Weitzman

CEO i fundador de Speechify

El generador de veu amb IA n.º 1.
Crea enregistraments de veu
amb qualitat humana en temps real.

apple logoPremi de Disseny Apple 2025
Més de 50 M d'usuaris

Crear subtítols és una feinada. Pots trigar dies a fer-ho bé. A més, pot costar entendre algunes veus per diversos motius: soroll de fons, accents marcats o argot. La transcripció a Google Docs pot acabar no tenint cap sentit.

Per sort, les apps de veu a text ja són una realitat. N’hi ha moltes en línia, algunes gratuïtes. Et presentem les millors per fer-te més fàcil la feina de transcripció. Vegem-les!

Descript

Descript és imprescindible si busques una app de transcripció econòmica. És fàcil d’usar i converteix àudio de reunions o converses en text en qüestió de segons. Reconeix 21 idiomes a més de l’anglès, com espanyol, alemany o portuguès.

La seva funció clau és que admet arxius d’àudio i vídeo, amb diversos interlocutors reconeguts automàticament, cosa que et fa la feina molt més fàcil.

Tot i ser automàtica, Descript permet moltes opcions manuals. Pots millorar la qualitat del so per revisar què s’està transcrivint, afegir efectes o música, igual que en programes avançats d’edició de vídeo o àudio.

Quant a preus, Descript té una versió gratuïta amb 3 hores de transcripció al dia. Si en vols més, pots subscriure’t als plans Creator, Pro o Enterprise, des de 12 $ l’any i amb preus personalitzats.

Fathom

Amb l’auge de Zoom, gravar reunions s’ha tornat habitual. Revisar-les vol dir haver-les de tornar a escoltar, cosa que pot ser molt feixuga per la mida dels arxius i el temps que requereix.

Aquí és on entra en joc Fathom. Aquesta eina grava i transcriu reunions de Zoom llargues. També permet afegir marcadors de temps perquè no hagis de fer el resum tu mateix, convertint moments concrets en notes.

Fathom pot dividir vídeos llargs en clips curts que pots compartir amb col·legues. També identifica preguntes i les envia al teu equip de suport sense més trucades ni gestió extra.

L’únic inconvenient de Fathom és que només funciona en anglès. Tot i això, com a solució gratuïta, és més que vàlida per a qui no tingui pressupost.

Murf AI

Els serveis de transcripció són bidireccionals. Algunes apps passen àudio a text i d’altres, text a veu. Murf AI destaca entre aquestes últimes i és ideal per a qui té dificultats lectores (dislèxia, TDAH o discapacitat visual).

Amb Murf AI, pots triar veus variades per llegir en alt el text. Inclou diferents accents, gèneres i idiomes. Són tan realistes que sembla que una persona llegeixi el text en comptes d’una IA.

Murf AI no només serveix per a qui té dificultats lectores. És molt útil per a creadors de contingut que volen veus úniques per als seus vídeos, podcasts o altres projectes.

Murf AI ofereix versió gratuïta, per això el recomanem. Però només permet 10 minuts de veu al dia. Si en vols més, caldrà pagar el pla Bàsic (13 $), Pro (26 $) o Enterprise (167 $) mensuals.

Speechnotes

Speechnotes transcriu àudio a text de manera molt senzilla. Funciona com a app a Android i com a complement al navegador Chrome en Windows. El seu principal avantatge és que és totalment gratuïta i fa tot el que caldria esperar d’una eina freeware.

A diferència d’altres apps gratuïtes, Speechnotes no té límits importants. Entén qualsevol format d’àudio (WAV, mp3, etc.) i ofereix transcripcions precises. Però no permet generar subtítols SRT ni funciona a iOS o Mac. Tot i això, continua sent gratuïta.

Speechify com a alternativa en reconeixement de veu

Algunes apps passen àudio a text i d’altres converteixen text en veu mitjançant programari TTS. La millor mostra n’és Speechify.

Speechify ofereix més de 30 veus naturals en més de 15 idiomes. També pot convertir fotos amb text a àudio en temps real.

Speechify permet importar e-books d’Audible amb la versió gratuïta. Només cal provar Speechify i entendràs per què és l’app TTS més popular.

Preguntes freqüents

Com puc transcriure àudio gratis?

Per fer-ho, descarrega’t o registra’t a apps gratuïtes de veu a text. N’hi ha moltes disponibles en línia.

Hi ha un programa gratuït que converteixi àudio en text?

  • Descript
  • Otter
  • Rev
  • oTranscribe
  • Fathom

Google té transcripció gratuïta?

Sí, pots utilitzar Google Cloud Speech-to-Text gratis.

Quins avantatges té transcriure àudio?

Ajudar persones amb pèrdua auditiva, o revisar llargues reunions de Zoom i resums per valorar-les millor.

Produeix doblatges, traduccions i clones amb més de 1.000 veus en més de 100 idiomes

Prova-ho gratis
studio banner faces

Comparteix aquest article

Cliff Weitzman

Cliff Weitzman

CEO i fundador de Speechify

Cliff Weitzman és un defensor de la dislèxia i el CEO i fundador de Speechify, l'app de text a veu número 1 al món, amb més de 100.000 ressenyes de 5 estrelles i líder del rànquing de l'App Store en Notícies i Revistes. El 2017, Weitzman va entrar a la llista Forbes 30 under 30 per la seva tasca fent internet més accessible per a persones amb dificultats d'aprenentatge. Cliff Weitzman ha aparegut a EdSurge, Inc., PC Mag, Entrepreneur, Mashable i altres mitjans destacats.

speechify logo

Sobre Speechify

El millor lector de text a veu

Speechify és la plataforma líder mundial de text a veu, de confiança per a més de 50 milions d'usuaris i avalada per més de 500.000 ressenyes de cinc estrelles a les seves aplicacions de text a veu per a iOS, Android, Extensió de Chrome, aplicació web i aplicació per a Mac. El 2025, Apple va premiar Speechify amb el prestigiós Premi de Disseny Apple a la WWDC, qualificant-lo com “una eina essencial que ajuda la gent a viure la seva vida.” Speechify ofereix més de 1.000 veus naturals en més de 60 idiomes i s'utilitza a gairebé 200 països. Entre les veus de celebritats hi trobem Snoop Dogg i Gwyneth Paltrow. Per a creadors i empreses, Speechify Studio proporciona eines avançades com Generador de veu IA, Clonació de veus IA, Doblatge IA i el seu Canviador de veu IA. Speechify també impulsa productes líders amb la seva API de text a veu, d'alta qualitat i amb una relació qualitat-preu òptima API de text a veu. Present en The Wall Street Journal, CNBC, Forbes, TechCrunch i altres mitjans destacats, Speechify és el proveïdor de text a veu més gran del món. Visiteu speechify.com/news, speechify.com/blog i speechify.com/press per saber-ne més.