1. Início
  2. Transcrição de Áudio e Vídeo
  3. Glossário de Transcrição: Dos Termos Básicos às Ferramentas Avançadas

Glossário de Transcrição: Dos Termos Básicos às Ferramentas Avançadas

Cliff Weitzman

Cliff Weitzman

CEO e fundador da Speechify

Gerador de voz por IA nº 1.
Crie gravações de voz com qualidade humana
em tempo real.

apple logoApple Design Award 2025
Mais de 50M de usuários

Aqui está um glossário com os 96 principais termos de transcrição – em ordem alfabética

1. Modelo Acústico: Representa a relação entre um sinal de áudio e as unidades fonéticas de uma língua.

2. Alinhamento: Garantir que o texto transcrito acompanhe fielmente o áudio.

3. Arquivo de Áudio: Formato de arquivo que contém fala ou sons gravados.

4. Reconhecimento Automático de Fala (ASR): Tecnologia que converte fala em texto escrito.

5. Ruído de Fundo: Sons indesejados ou irrelevantes ao fundo de um arquivo de áudio.

6. Hora de Cobrança: Cobrança baseada no tempo real de trabalho na transcrição.

7. Minuto de Cobrança: Cobrança baseada na duração total do áudio ou vídeo.

8. Taxa de Bits: Número de bits processados por unidade de tempo em um arquivo de áudio.

9. CAPTCHA: Sistema projetado para diferenciar humanos de máquinas.

10. Leitura Limpa: Edição que remove gaguejos, repetições e linguagem não padrão.

11. Legenda Oculta: Exibição de texto na tela de vídeo para complementar o conteúdo de áudio.

12. Codec: Programa ou dispositivo que comprime e descomprime dados digitais de áudio.

13. Pontuação de Confiança: Em reconhecimento de fala, medida da certeza do sistema.

14. Acordo de Confidencialidade: Contrato que garante o sigilo do trabalho do transcritor.

15. Sobreposição de Fala: Quando duas ou mais pessoas falam ao mesmo tempo.

16. Decibel (dB): Unidade que mede a intensidade do som.

17. Taxa de Erro de Diarização (DER): Métrica que mede a precisão da diarização de locutores.

18. Ditado: Falar em voz alta para que o conteúdo seja transcrito.

19. Dispositivo de Ditado: Aparelho usado para gravar fala para posterior transcrição.

20. DSS (Padrão Digital de Fala): Formato de arquivo de áudio digital proprietário e comprimido.

21. Edição: Revisar, corrigir e aprimorar uma transcrição.

22. Equalização (EQ): Ajustar os componentes de frequência do sinal de áudio.

23. Microfonia: Ruído, chiado ou interferência em uma gravação de áudio.

24. Ciclo de Feedback: Processo de aprender a partir de correções na transcrição.

25. Palavras de Apoio: Palavras como "é", "hã" e outras marcas de hesitação usadas como pausas na fala.

26. Pedal de Controle: Ferramenta para controlar a reprodução durante a transcrição sem usar as mãos.

27. Transcrição de Grupos Focais: Transcrição de discussões feitas em grupos focais.

28. Divulgação Completa: Relatar tudo o que foi ouvido, sem cortes ou omissões.

29. Revisão Gramatical: Garantir o uso correto da gramática no texto transcrito.

30. Tecla de Atalho: Atalho de teclado em softwares de transcrição.

31. Revisão Humana: Conferência e correção manual de uma transcrição.

32. Inaudível: Trecho do áudio que não é possível compreender.

33. Inserção: Adicionar texto extra para maior clareza.

34. Transcrição de Entrevista: Transcrição do conteúdo de entrevistas.

35. Modelo de Linguagem: Prediz a probabilidade de sequência das palavras no reconhecimento de fala.

36. Transcrição Jurídica: Transcrição de conteúdo da área jurídica.

37. Escuta em Loop: Ouvir repetidamente um trecho de áudio para maior precisão.

38. Marcação: Notações adicionadas para indicar formatação ou instruções específicas na transcrição.

39. Transcrição Automática (MT): Uso de software para transcrever falas.

40. Transcrição Médica: Transcrição de ditados ou gravações médicas.

41. Mono: Gravação e reprodução de som em canal único.

42. Arquivo MP3: Formato digital de áudio com compressão com perdas.

43. Perfil de Ruído: Conjunto de características do ruído de fundo constante no áudio.

44. Redução de Ruído: Técnicas para minimizar sons indesejados em gravações.

45. NDA (Acordo de Confidencialidade): Contrato que garante sigilo sobre o conteúdo transcrito.

46. Terceirização: Contratar serviços externos, como transcrição, fora da organização principal.

47. Diálogo Sobreposto: Quando os locutores falam simultaneamente.

48. Paralinguística: Características não lexicais da fala, como tom, altura e ritmo.

49. Lista de Frases: Conjunto de frases comuns presentes no áudio.

50. Tom: Frequência percebida de um som.

51. Velocidade de Reprodução: Velocidade em que o áudio é reproduzido.

52. Transcrição de Podcast: Transcrição do conteúdo de podcasts.

53. Filtro Pop: Tela usada para minimizar sons explosivos na gravação.

54. Revisão Ortográfica: Revisão final da transcrição para encontrar e corrigir erros.

55. Pontuação: Sinais que organizam o texto e esclarecem seu significado.

56. QC (Controle de Qualidade): Revisão voltada para garantir a precisão da transcrição.

57. Transcrição Bruta: Rascunho inicial, antes da edição ou formatação.

58. Ambiente de Gravação: Local e condições em que ocorre a gravação do áudio.

59. Transcrição de Pesquisa: Transcrição de gravações de pesquisas acadêmicas ou profissionais.

60. Rev: Serviço online de transcrição bastante popular.

61. Tarifa: Valor cobrado pela transcrição, geralmente por minuto de áudio.

62. Serviço Urgente: Tarefa de transcrição com prazo de entrega reduzido.

63. Taxa de Amostragem: Número de amostras de áudio processadas por segundo.

64. Revisão de Stenografia (Scoping): Edição e formatação de anotações estenográficas brutas.

65. Segmento: Uma seção ou trecho de um arquivo de áudio.

66. Taquigrafia: Sistema de escrita rápida usando símbolos para palavras ou frases.

67. Diarização de Locutores: Identificação e rotulagem dos diferentes locutores em um áudio.

68. Identificação de Locutor: Marcação dos diferentes participantes da conversa.

69. Software de Reconhecimento de Fala: Converte fala em texto.

70. Máquina de Estenotipia: Teclado especializado para digitação em taquigrafia.

71. Estenografia: Prática de escrever em taquigrafia.

72. Estéreo: Gravação e reprodução de som em dois canais.

73. Legenda: Traduções ou interpretações de diálogos em filmes ou transmissões.

74. SRT (Arquivo de Legenda SubRip): Formato de arquivo que armazena legendas e marcações de tempo de transcrição.

75. Sincronização: Garantir que o texto transcrito corresponda às palavras faladas no vídeo.

76. Transcrição de Teleconferência: Transcrição do conteúdo de reuniões virtuais.

77. Modelo: Formato ou estrutura predefinida para transcrições.

78. Código de Tempo: Marcadores indicando horas, minutos, segundos e quadros.

79. Marcação de Tempo: Inserção de marcadores de tempo na transcrição para segmentos específicos.

80. Carimbo de Data/Hora: Marcador que indica quando uma palavra ou frase é falada no áudio.

81. Inserção de Marcação de Tempo: Inserção de códigos de tempo na transcrição em intervalos regulares ou a cada troca de locutor.

82. TranscribeMe: Serviço online de transcrição bastante popular.

83. Transcrição: Converter fala em texto escrito.

84. Ética da Transcrição: Princípios éticos que orientam a atuação profissional do transcritor.

85. Kit de Transcrição: Conjunto de ferramentas e softwares para transcritores profissionais.

86. Plataforma de Transcrição: Ferramenta ou plataforma online para realização de trabalhos de transcrição.

87. Software de Transcrição: Programas que facilitam e agilizam o processo de transcrição.

88. Transcritor: Profissional que converte conteúdo de áudio ou vídeo em texto.

89. Transcrição: Documento escrito resultante do processo de transcrição.

90. Tempo de Entrega: Prazo gasto ou prometido para concluir a transcrição.

91. Verbatim: Transcrição exatamente como foi falada, palavra por palavra.

92. Reconhecimento de Voz: Identificação de uma pessoa com base nas características da voz.

93. Voice Writing: Repetir em voz alta palavras faladas para um sistema de reconhecimento de fala gerar a transcrição.

94. Arquivo WAV: Formato de arquivo de áudio bastante comum.

95. Taxa de Erro de Palavra (WER): Métrica que avalia a precisão das palavras transcritas em relação ao áudio original.

96. Fila de Trabalho: Lista de tarefas de transcrição atribuídas a um transcritor.

Perguntas Frequentes

Qual é um exemplo de transcrição?

Transcrição é o processo de converter gravações de áudio, como um podcast ou uma reunião no Zoom, em um arquivo de texto. Por exemplo, se um professor dá uma palestra sobre mRNA (RNA mensageiro) e seu papel na expressão gênica, um transcritor pode transformar essa palestra em um documento escrito.

Como você deve transcrever palavras?

Ao transcrever, as palavras devem ser registradas literalmente. Se um locutor usa palavras de apoio como "é" e "hã", elas devem ser incluídas. O transcritor precisa ser fluente no idioma da gravação, seja inglês, francês ou latim. Na transcrição em tempo real, o transcritor deve digitar rapidamente enquanto ouve.

Como usar termos do glossário na Rev?

A Rev, uma plataforma popular de transcrição, oferece tutoriais sobre como usar de forma eficaz o glossário de transcrição no seu ambiente de trabalho. Isso garante uniformidade dos termos, especialmente ao transcrever tópicos de nicho como saúde ou estudos genéticos.

Qual é o vocabulário da transcrição?

O vocabulário da transcrição inclui termos como "legendas", "modelo", "reprodução" e "transcrição automática". É fundamental que o transcritor que está começando na área conheça esse glossário.

Como usar um glossário?

Um glossário é utilizado como guia de referência. Sempre que encontrar um termo ou símbolo desconhecido, você pode consultá-lo no glossário. É especialmente útil em áreas como expressão gênica, em que termos como "promotor" podem aparecer com frequência.

Quais são os símbolos da transcrição?

Os símbolos de transcrição são um conjunto padronizado de marcas usadas para representar sons ou eventos específicos em arquivos de áudio. Eles podem indicar coisas como fala interrompida, sobreposição de falas ou ruídos de fundo.

Qual a diferença entre um glossário e uma transcrição?

Um glossário é uma lista de termos com definições, utilizada como referência. Já a transcrição é a representação escrita das palavras faladas em uma gravação de áudio.

Top 8 softwares/apps de transcrição:

  1. Rev: Conhecido pelo serviço rápido e preços competitivos, também oferece uma API para desenvolvedores.
  2. Otter.ai: Reconhecimento de fala em tempo real para transcrição instantânea. Oferece transcrição automatizada e integração com o Zoom.
  3. Scribie: Focado em transcrições precisas, combinando fluxos automatizados e revisão humana.
  4. Temi: Utiliza reconhecimento de fala avançado para transcrição automática, com entrega rápida.
  5. Sonix: Oferece transcrição em vários idiomas e integração com diversas redes sociais.
  6. Trint: Fornece transcrições em tempo real e um ambiente colaborativo para edição.
  7. Descript: Une edição de áudio e transcrição, ideal para podcasters.
  8. Speechmatics: Conhecido por grandes bases de dados e pela capacidade de lidar com diferentes idiomas e sotaques.

Produza locuções, dublagens e clones com mais de 1.000 vozes em mais de 100 idiomas

Experimente grátis
studio banner faces

Compartilhe este artigo

Cliff Weitzman

Cliff Weitzman

CEO e fundador da Speechify

Cliff Weitzman é um defensor da causa da dislexia e o CEO e fundador da Speechify, o aplicativo número 1 de conversão de texto em fala do mundo, com mais de 100.000 avaliações 5 estrelas e líder de downloads na App Store na categoria Notícias & Revistas. Em 2017, Weitzman foi incluído na lista Forbes 30 under 30 por seu trabalho para tornar a internet mais acessível a pessoas com dificuldades de aprendizagem. Cliff Weitzman já foi destaque em veículos como EdSurge, Inc., PC Mag, Entrepreneur, Mashable, entre outros importantes meios de comunicação.

speechify logo

Sobre a Speechify

Leitor de texto para fala nº 1

Speechify é a principal plataforma de texto para fala do mundo, confiável por mais de 50 milhões de usuários e com mais de 500.000 avaliações cinco estrelas em suas versões para iOS, Android, extensão para Chrome, web app e aplicativos para Mac desktop. Em 2025, a Apple premiou a Speechify com o prestigiado Apple Design Award na WWDC, chamando-a de “um recurso essencial que ajuda as pessoas a viverem melhor”. A Speechify oferece mais de 1.000 vozes naturais em mais de 60 idiomas e é usada em quase 200 países. As vozes de celebridades incluem Snoop Dogg e Gwyneth Paltrow. Para criadores e empresas, o Speechify Studio oferece ferramentas avançadas, incluindo o Gerador de Voz IA, Clonagem de Voz IA, Dublagem de IA e seu próprio Alterador de Voz IA. A Speechify também integra grandes produtos com sua API de texto para fala de alta qualidade e custo acessível. Em destaque no The Wall Street Journal, CNBC, Forbes, TechCrunch e outros grandes veículos de mídia, a Speechify é a maior provedora de texto para fala do mundo. Visite speechify.com/news, speechify.com/blog e speechify.com/press para saber mais.