1. Inici
  2. Transcripció d’àudio i vídeo
  3. Glossari de transcripció: dels termes bàsics al programari avançat
Publicat el Transcripció d’àudio i vídeo

Glossari de transcripció: dels termes bàsics al programari avançat

Cliff Weitzman

Cliff Weitzman

CEO i fundador de Speechify

El generador de veu amb IA n.º 1.
Crea enregistraments de veu
amb qualitat humana en temps real.

apple logoPremi de Disseny Apple 2025
Més de 50 M d'usuaris

Aquí tens un glossari amb els 96 termes principals sobre transcripció, ordenats alfabèticament

1. Model acústic: Representa la relació entre el senyal d’àudio i les unitats fonètiques d’una llengua.

2. Alineació: Assegurar que el text transcrit coincideix amb l’àudio.

3. Fitxer d'àudio: Format de fitxer que conté veu o altres sons gravats.

4. Reconeixement automàtic de veu (ASR): Tecnologia que converteix llenguatge parlat en text escrit.

5. Soroll de fons: Sons no desitjats o irrellevants en una gravació d’àudio.

6. Hora facturada: Facturació basada en el temps real dedicat a transcriure.

7. Minut facturat: Preu calculat segons la durada total d’àudio o vídeo.

8. Taxa de bits: Nombre de bits processats per unitat de temps en un àudio.

9. CAPTCHA: Sistema per distingir entre un humà i una màquina.

10. Lectura neta: Eliminar titubeigs, repeticions i paraules no estàndard.

11. Subtitulació oculta: Mostra de text a la pantalla de vídeo per aportar informació addicional.

12. Còdec: Programa o dispositiu que comprimeix i descomprimeix àudio digital.

13. Puntuació de confiança: En reconeixement de veu, mesura el grau de certesa del sistema.

14. Acord de confidencialitat: Contracte per garantir la no divulgació d’informació per part del transcriptor.

15. Barreja de veus: Dues o més persones parlant alhora.

16. Decibel (dB): Unitat emprada per mesurar la intensitat del so.

17. Taxa d’error de diarització (DER): Mètrica que avalua la precisió de la diarització de parlants.

18. Dictat: Parlar en veu alta perquè el discurs es pugui transcriure.

19. Dispositiu de dictat: Aparell per gravar veu amb vista a la transcripció.

20. DSS (Digital Speech Standard): Format propietari d'àudio digital comprimit.

21. Edició: Corregir i polir una transcripció.

22. Equalització (EQ): Ajustar les freqüències del senyal d’àudio.

23. Feedback: Soroll o interferències en una gravació.

24. Bucle de feedback: Procés d’aprendre a partir de les correccions en la transcripció.

25. Muletilles: Paraules tipus “eh”, “am” utilitzades com a pausa.

26. Pedal: Eina per controlar la reproducció sense mans mentre es transcriu.

27. Transcripció de grup focal: Transcriure enregistraments de grups focals.

28. Divulgació total: Transcriure tot allò que s’escolta sense omissions.

29. Revisió gramatical: Verificar la gramàtica del text transcrit.

30. Drecera de teclat: Combinació de tecles en programari de transcripció.

31. Revisió manual: Comprovar i corregir manualment una transcripció.

32. Inintel·ligible: Fragment d’àudio que no s’entén bé.

33. Inserció: Afegir text extra per donar més claredat.

34. Transcripció d’entrevista: Transcriure el contingut d’una entrevista.

35. Model lingüístic: Calcula la probabilitat de seqüències de paraules en reconeixement de veu.

36. Transcripció legal: Transcriure continguts o documents legals.

37. Escolta en bucle: Escoltar repetidament un fragment per guanyar exactitud.

38. Marcatge: Anotacions per indicar format especial en una transcripció.

39. Transcripció automàtica (MT): Utilitzar programari per transcriure la parla.

40. Transcripció mèdica: Transcripció de dictats o gravacions mèdiques.

41. Mono: Gravació i reproducció de so en un sol canal.

42. Fitxer MP3: Format d’àudio digital amb compressió amb pèrdua.

43. Perfil de soroll: Característiques dels sorolls de fons constants.

44. Reducció de soroll: Tècniques per minimitzar sons no desitjats en àudio.

45. NDA (Acord de confidencialitat): Contracte per garantir la confidencialitat.

46. Externalitzar: Contractar serveis externs com la transcripció.

47. Diàleg superposat: Quan diversos parlants parlen alhora.

48. Paralingüística: Elements no lèxics de la parla, com ara to i entonació.

49. Llista de frases: Llistat de frases recurrents en àudios.

50. To: Freqüència percebuda d’un so.

51. Velocitat de reproducció: Velocitat a la qual es reprodueix l’àudio.

52. Transcripció de podcast: Transcriure el contingut d’un podcast.

53. Filtre antipop: Pantalla per minimitzar sons explosives en la gravació.

54. Revisió: Repàs final de la transcripció per detectar errors.

55. Puntuació: Signes que ajuden a clarificar el significat del text.

56. QC (Control de qualitat): Revisió per assegurar la precisió de la transcripció.

57. Transcripció en brut: Esborrany inicial abans d’editar o donar format.

58. Entorn de gravació: Espai on es duu a terme la gravació d’àudio.

59. Transcripció de recerca: Transcripció d’enregistraments acadèmics o professionals.

60. Rev: Servei de transcripció en línia molt popular.

61. Tarifa: Preu cobrat per la transcripció, sovint per minut d’àudio.

62. Treball urgent: Encàrrec de transcripció amb un termini molt curt.

63. Taxa de mostreig: Nombre de mostres d’àudio per segon.

64. Edició ràpida: Editar i donar format a notes estenogràfiques.

65. Segment: Secció d’un fitxer d’àudio.

66. Estenografia abreujada: Sistema d’escriptura ràpida mitjançant símbols.

67. Diarització de parlants: Identificar i etiquetar els diferents parlants en un àudio.

68. Identificació de parlants: Etiquetar els diferents interlocutors.

69. Programari de reconeixement de veu: Converteix llenguatge parlat en text.

70. Màquina d’estenotípia: Teclat especialitzat per escriure en estenografia.

71. Estenografia: Escriptura ràpida amb símbols.

72. Estèreo: Gravació i reproducció de so en dos canals.

73. Subtítol: Traduccions o interpretacions de diàlegs en pel·lícules o emissions.

74. SRT (SubRip Subtitle file): Format per guardar subtítols i els seus temps de transcripció.

75. Sincronització: Fer coincidir el text transcrit amb els diàlegs.

76. Transcripció de teleconferència: Transcriure el contingut de reunions virtuals.

77. Plantilla: Format predeterminat per a transcripcions.

78. Codi de temps: Marques que indiquen hora, minut, segon i fotogrames.

79. Codificació temporal: Posar marques de temps en segments específics.

80. Marcatge temporal: Marca per indicar quan es diu una paraula a l’àudio.

81. Assignació de temps: Inserir codis de temps a intervals regulars o en canviar de parlant.

82. TranscribeMe: Servei de transcripció en línia popular.

83. Transcripció: Convertir llenguatge oral en text escrit.

84. Ètica de la transcripció: Principis morals que regeixen la professió de transcriptor.

85. Kit de transcripció: Paquet d’eines i programari per a professionals.

86. Plataforma de transcripció: Eina o espai online per fer transcripcions.

87. Programari de transcripció: Programes que faciliten la transcripció.

88. Transcriptor/a: Persona que converteix àudio o vídeo en text.

89. Transcripció (document): Document escrit resultant de la transcripció.

90. Temps d’entrega: Temps necessari o compromès per completar una transcripció.

91. Literal: Transcriure exactament el que es diu.

92. Reconeixement de veu: Identificació d’una persona a partir de la seva veu.

93. Dictat de veu: Dir paraules a un sistema de reconeixement de veu perquè les transcrigui.

94. Fitxer WAV: Format de fitxer d’àudio molt habitual.

95. Word Error Rate (WER): Mètrica que mesura l’exactitud de les paraules transcrites.

96. Cua de treball: Llista de tasques de transcripció pendents per al transcriptor.

Preguntes freqüents

Quin és un exemple de transcripció?

La transcripció és el procés de convertir gravacions d’àudio, com un podcast o una reunió de Zoom, a format text. Per exemple, si un professor fa una classe sobre mRNA (ARN missatger) i la seva funció en l’expressió gènica, el/la transcriptor/a pot convertir la classe en un document escrit.

Com s’han de transcriure les paraules?

Quan es transcriu, les paraules s’han d’escriure literalment. Si l’orador utilitza muletilles com “eh” o “am”, s’han d’incloure. El/la transcriptor/a ha de ser competent en la llengua de la gravació: anglès, francès, llatí... La transcripció en temps real requereix escriure de pressa mentre s’escolta.

Com s’usen els termes del glossari a Rev?

Rev, una plataforma de transcripció popular, ofereix tutorials sobre l’ús del seu glossari dins de l’espai de treball. Això garanteix uniformitat, sobretot en camps especialitzats com la salut o els estudis genètics.

Quin és el vocabulari de la transcripció?

El vocabulari inclou termes com “subtítols”, “plantilla”, “reproducció” i “transcripció automàtica”. És clau familiaritzar-s’hi per a qui es vol introduir al sector.

Com s’utilitza un glossari?

Un glossari serveix de guia de consulta. Si es troba un terme o símbol desconegut, s’hi pot recórrer. És especialment útil en camps com l’expressió gènica, on poden aparèixer termes com “promotor”.

Quins són els símbols de transcripció?

Els símbols de transcripció són signes estandarditzats per representar sons o esdeveniments específics als fitxers d’àudio. Poden indicar parla interrompuda, superposada o sorolls de fons.

Quina diferència hi ha entre glossari i transcripció?

Un glossari és una llista de termes amb definicions per a consulta. Una transcripció és la representació escrita de les paraules pronunciades en una gravació.

Els 8 millors programes/apps de transcripció:

  1. Rev: Ràpid, preu competitiu i API per a desenvolupadors.
  2. Otter.ai: Reconeixement de veu en temps real, transcripció automàtica i integració amb Zoom.
  3. Scribie: Precisió combinant automatització i revisió humana.
  4. Temi: Reconeixement avançat per a transcripció automàtica ràpida.
  5. Sonix: Transcripció multilingüe i integració amb xarxes socials.
  6. Trint: Transcripció en temps real i espai per a edició col·laborativa.
  7. Descript: Integra edició d’àudio amb transcripció, ideal per a podcasts.
  8. Speechmatics: Gran base de dades, suporta idiomes i dialectes diversos.

Produeix doblatges, traduccions i clones amb més de 1.000 veus en més de 100 idiomes

Prova-ho gratis
studio banner faces

Comparteix aquest article

Cliff Weitzman

Cliff Weitzman

CEO i fundador de Speechify

Cliff Weitzman és un defensor de la dislèxia i el CEO i fundador de Speechify, l'app de text a veu número 1 al món, amb més de 100.000 ressenyes de 5 estrelles i líder del rànquing de l'App Store en Notícies i Revistes. El 2017, Weitzman va entrar a la llista Forbes 30 under 30 per la seva tasca fent internet més accessible per a persones amb dificultats d'aprenentatge. Cliff Weitzman ha aparegut a EdSurge, Inc., PC Mag, Entrepreneur, Mashable i altres mitjans destacats.

speechify logo

Sobre Speechify

El millor lector de text a veu

Speechify és la plataforma líder mundial de text a veu, de confiança per a més de 50 milions d'usuaris i avalada per més de 500.000 ressenyes de cinc estrelles a les seves aplicacions de text a veu per a iOS, Android, Extensió de Chrome, aplicació web i aplicació per a Mac. El 2025, Apple va premiar Speechify amb el prestigiós Premi de Disseny Apple a la WWDC, qualificant-lo com “una eina essencial que ajuda la gent a viure la seva vida.” Speechify ofereix més de 1.000 veus naturals en més de 60 idiomes i s'utilitza a gairebé 200 països. Entre les veus de celebritats hi trobem Snoop Dogg i Gwyneth Paltrow. Per a creadors i empreses, Speechify Studio proporciona eines avançades com Generador de veu IA, Clonació de veus IA, Doblatge IA i el seu Canviador de veu IA. Speechify també impulsa productes líders amb la seva API de text a veu, d'alta qualitat i amb una relació qualitat-preu òptima API de text a veu. Present en The Wall Street Journal, CNBC, Forbes, TechCrunch i altres mitjans destacats, Speechify és el proveïdor de text a veu més gran del món. Visiteu speechify.com/news, speechify.com/blog i speechify.com/press per saber-ne més.