As soluções de texto para fala (TTS) tornaram-se uma parte indispensável da tecnologia assistiva, ajudando inúmeros usuários de PC a interagir com o texto escrito, seja para lazer, estudos ou trabalho.
Como você pode imaginar, o mercado de TTS está um tanto saturado, com dezenas de aplicativos e extensões de navegador para escolher. A maioria deles é bastante útil e faz maravilhas pela sua produtividade, além de tornar a experiência de uso muito mais agradável. Hoje, vamos focar na solução de TTS da Microsoft — o Azure.
O que é o texto para fala da Microsoft?
O que é o Azure, afinal? Para responder a essa pergunta, podemos fazer outra: você quer ter o poder de criar conteúdos com narrações de voz naturais ou ouvir suas páginas favoritas sendo lidas para você, com uma série de parâmetros personalizáveis que permitem ajustar velocidade, tom, pronúncia e muito mais? O Microsoft Azure permite que você faça tudo isso — e muito mais.
O Azure é uma plataforma em nuvem cheia de potencial. Além dos serviços cognitivos do Azure, que oferecem excelentes textos para fala e soluções de fala para texto, você pode usar o armazenamento e a análise em nuvem do Azure para aumentar ainda mais sua produtividade, sem precisar dominar técnicas avançadas de machine learning.
Por ser compatível com várias soluções open-source, o Azure também é bastante flexível. Incluir narrações de voz em aplicativos personalizados e permitir que seu público se beneficie de aprendizado de máquina avançado nunca foi tão fácil, especialmente com os mais de cem idiomas e variantes linguísticas que o Azure oferece.
Como usar o aplicativo de texto para fala da Microsoft no seu iPhone ou computador
Configurar o Microsoft Azure no seu dispositivo é bem simples, e bastam alguns cliques para se inscrever no site oficial do Azure. No entanto, se o seu uso do computador não vai muito além de programas como Outlook, Word, PowerPoint, Docs e OneNote, você não precisará baixar nada, pois esses programas já vêm com uma solução integrada de síntese de voz chamada Speak.
Embora não seja um serviço de voz de alta qualidade, o Speak quebra um galho em situações de emergência e é muito fácil de configurar:
- Clique na opção Personalizar Barra de Ferramentas e, em seguida, clique
- Selecione a opção Mais Comandos
- Clique em Todos os Comandos
- Encontre Speak, clique nele e depois clique em Adicionar
Alternativas ao aplicativo de texto para fala da Microsoft
Como mencionamos na introdução, há muitos leitores de texto, variando desde aplicativos profissionais com preços salgados até SDKs de reconhecimento de fala ainda inacabados no GitHub. Se o assistente de voz de texto para fala da Microsoft não é o que você procura, ou se quiser alternativas, trouxemos algumas opções que certamente vão te agradar.
Speechify
Em primeiro lugar está o Speechify, a ferramenta de TTS mais bem avaliada, capaz de transformar praticamente qualquer coisa em um arquivo de áudio. Funciona com todos os aplicativos da Microsoft, e seus modelos de fala vão te surpreender. Somando isso a ótimos recursos de API de voz, você tem uma solução versátil para todas as suas necessidades e usos.
Amazon Polly
Em segundo lugar está o Amazon Polly, uma solução fantástica conhecida por suas vozes naturais e diversos estilos de fala. Oferece suporte a vários idiomas, e sua tecnologia neural de texto para fala proporciona muitas configurações personalizáveis para você experimentar sempre que quiser dar um toque especial às suas narrações mais autênticas.
Google Cloud Text to Speech
Na terceira posição temos o Cloud Text to Speech do Google. Naturalmente, onde há avanços tecnológicos, o Google está presente, e o universo TTS não fica de fora. A solução do Google trabalha principalmente com a linguagem de marcação de síntese de fala (SSML) e funciona no modelo de pagamento por caractere, o que a torna uma escolha prática e acessível para projetos pontuais.
IBM Watson Text to Speech
O IBM Watson fica em quarto lugar. O diferencial do Watson é sua versatilidade em ambientes corporativos. Você pode usá-lo como assistente virtual, ferramenta de suporte ao cliente e solução de texto para fala. Além disso, é muito em conta, então você dificilmente encontrará uma opção tão flexível por um preço melhor.
Readspeaker
Em quinto lugar temos um dos veteranos — o Readspeaker. Com cerca de um quarto de século de experiência, o Readspeaker domina a arte do TTS. Oferece suporte a mais de cem idiomas e é excelente para estúdios de voz e e-learning, pois pode funcionar tanto online quanto offline.
NaturalReader
O sexto lugar é do NaturalReader. Este aplicativo tem ótimo desempenho na fala sintetizada em tempo real e funciona com praticamente todos os aplicativos usados no seu PC. O que garantiu lugar ao NaturalReader na lista é o seu chamado "modo leitor", que elimina do texto todas as informações desnecessárias, como anúncios.
VoiceDream Reader
Na sétima posição temos o VoiceDream Reader, nossa última alternativa ao Microsoft Azure texto para fala de hoje. Infelizmente, embora o VoiceDream Reader seja bom para tarefas mais simples, muitos usuários reclamam da falta de acessibilidade e das opções de sincronização ruins. Mas, se você precisa de uma solução rápida e não faz questão das tecnologias mais avançadas de TTS neural e ponta a ponta, o VoiceDream dá conta do recado.
Perguntas frequentes
O TTS do Windows 10 é gratuito?
Existem muitas soluções de TTS para o Windows 10. Algumas são gratuitas, outras não. A opção Speak integrada, que vem com o Windows 10 e funciona em programas como Outlook e Word, é gratuita, mas soluções mais sofisticadas, com vozes neurais personalizadas e outros recursos, como o Microsoft Azure, exigem assinatura.
Qual é a voz de TTS mais realista?
As vozes mais realistas de TTS geralmente estão presentes em ferramentas mais avançadas, como Amazon Polly e Speechify. O nível de realismo depende do idioma, do modelo de fala e dos parâmetros escolhidos.
Qual é a diferença entre texto para fala e reconhecimento de voz?
Embora muitos programas de TTS ofereçam opções de texto para fala e reconhecimento de voz, é importante não confundir os dois. As soluções de texto para fala transformam entradas textuais em áudio, ajudando você a interagir com o texto enquanto faz outras tarefas. Já o reconhecimento de voz se refere à análise da voz humana, seja para interpretá-la ou identificá-la.

