1. Início
  2. VoiceOver
  3. Preços e Planos do Amazon Polly
VoiceOver

Preços e Planos do Amazon Polly

Cliff Weitzman

Cliff Weitzman

CEO e fundador da Speechify

Gerador de voz por IA nº 1.
Crie gravações de voz com qualidade humana
em tempo real.

apple logoApple Design Award 2025
Mais de 50M de usuários

No cenário digital atual, a demanda por softwares de Texto para Fala (TTS) de alta qualidade está crescendo. O Amazon Polly, um serviço baseado em Inteligência Artificial (IA) da Amazon Web Services (AWS), oferece uma solução poderosa para converter textos em fala com voz natural. Este artigo vai aprofundar nos detalhes do Amazon Polly Text to Speech, abordando seus recursos, casos de uso, modelo de precificação e alternativas, para ajudar quem busca um entendimento completo sobre o preço dessa tecnologia.

Visão Geral das Vozes de IA

As vozes de IA oferecidas pelo Amazon Polly utilizam os mais recentes avanços em síntese de fala, imitando padrões vocais, entonações e emoções humanas.

As aplicações das vozes de IA e do Amazon Polly são inúmeras, permitindo que empresas e desenvolvedores otimizem a experiência do usuário em diversos setores. Alguns dos principais casos de uso incluem:

  • Dispositivos IoT: Adicionando recursos de voz a dispositivos da Internet das Coisas (IoT), tornando-os mais intuitivos e fáceis de usar.
  • Speech Synthesis Markup Language (SSML): Ajustando a saída de voz com etiquetas para controlar pausas, entonações e pronúncias.
  • Notificações e Alertas: Enviando atualizações em tempo real e notificações por mensagem de voz.
  • Podcast, Vídeo e Criação de Conteúdo: Arquivos de áudio do Amazon Polly podem ser usados para criar conteúdo para redes sociais e agilizar a produção.

O Amazon Polly é um serviço avançado de TTS baseado em nuvem TTS oferecido pelo AWS Console, fazendo parte da mesma família do AWS Lambda, Amazon S3 e Amazon SQS. Utilizando técnicas de machine learning e deep learning, ele converte texto em fala realista, proporcionando uma experiência auditiva excepcional. A versatilidade do Amazon Polly permite sua integração em diversas aplicações, incluindo plataformas web e mobile, dispositivos IoT, podcasts e muito mais.

Embora o software possa parecer intimidador à primeira vista, existem milhares de tutoriais disponíveis online que ensinam aos novos usuários os fundamentos do uso do Amazon Polly.

Modelo de Preços do Amazon Polly

O Amazon Polly adota um modelo de precificação pay-as-you-go, ou seja, você paga conforme o uso do serviço. Com esse modelo, você paga pela quantidade de caracteres convertidos em fala e pelas vozes específicas utilizadas.

Esse modelo oferece flexibilidade, escalabilidade e transparência, permitindo que empresas ajustem o uso conforme necessário, sem compromissos de longo prazo ou custos iniciais.

No entanto, pode ser difícil estimar o valor exato dos gastos nesse modelo. Para contornar isso, a Amazon oferece uma calculadora de preços da AWS e suporte para precificação com especialistas.

Pacotes do Amazon Polly

Camada Gratuita

Para ajudar novos usuários, o Amazon Polly oferece uma camada gratuita que inclui 5 milhões de caracteres por mês pelos primeiros 12 meses, permitindo que desenvolvedores explorem o serviço sem custos adicionais. Esta pode ser uma ótima opção para startups que precisam do serviço e querem manter os custos baixos.

Para Vozes Padrão, a camada gratuita inclui 5 milhões de caracteres por mês, enquanto para Vozes Neurais o limite é de 1 milhão de caracteres.

Vozes Padrão

As vozes padrão estão disponíveis a um baixo custo por caractere, fornecendo síntese de fala de alta qualidade adequada para a maioria dos casos de uso.

As vozes padrão do Amazon Polly são baseadas em síntese concatenativa, que consiste em combinar segmentos pré-gravados de fala humana para gerar a voz sintetizada. Essas vozes são criadas a partir de grandes quantidades de gravações de uma ou mais pessoas, compostas e montadas para formar uma voz.

O preço varia de acordo com a região e a voz selecionada, mas, em geral, o custo é de US$ 4,00 por 1 milhão de caracteres para solicitações de fala ou marcas de fala.

Vozes Neurais TTS

Já as vozes neurais TTS utilizam técnicas de deep learning e redes neurais para gerar fala. Essas vozes são criadas a partir do treinamento de modelos em grandes volumes de dados de fala, incluindo léxicos completos, o que permite capturar mais nuances do estilo de fala humana e entregar resultados ainda mais expressivos e realistas.

Essas vozes têm um preço superior ao das vozes padrão devido à tecnologia avançada envolvida. Em média, custam US$ 16,00 por 1 milhão de caracteres de fala.

Como faço para baixar o Amazon Polly?

Para utilizar o Amazon Polly, você não precisa baixar nenhum software, pois é uma plataforma baseada na web. Ela pode ser acessada pelo AWS Management Console com uma conta AWS ou via API do Amazon Polly de forma programática. Ao usar a API, desenvolvedores podem integrar as funcionalidades do Amazon Polly em suas aplicações de maneira transparente.

Alternativas ao Amazon Polly

Embora o Amazon Polly seja uma solução TTS poderosa, existem alternativas disponíveis no mercado. Uma dessas alternativas é o Speechify, um software TTS open-source com recursos próprios e exclusivos.

Speechify

O Speechify é uma alternativa de destaque ao Amazon Polly no universo de softwares de texto para fala. O Speechify reúne todas as funcionalidades essenciais do TTS e ainda oferece aos usuários diversas opções de personalização, como ajuste de velocidade, tom e volume da fala sintetizada para alcançar o efeito desejado e otimizar a produção para cada caso de uso.

Diferente do Amazon Polly, o Speechify não adota o modelo de cobrança por uso. Em vez disso, oferece planos distintos adaptados a diferentes necessidades.

O Speechify Limited, que é totalmente gratuito, dá acesso a 10 vozes padrão para leitura. A versão premium custa apenas US$ 11,58/mês e oferece mais de 20 opções de idiomas e ferramentas para anotações.

Ao contrário do Amazon Polly, o Speechify está disponível para iOS e Android, além de oferecer uma extensão para Chrome.

Conclusão

Conhecer opções alternativas permite comparar modelos de preços e escolher a estrutura de cobrança mais vantajosa para o seu perfil de uso. Isso ajuda a otimizar o seu orçamento e evita que você pague por recursos ou serviços desnecessários. Alternativas como o Speechify possuem características únicas. Ao explorar outras opções, você pode encontrar funcionalidades adicionais que se alinham melhor às suas demandas. Assim, é possível escolher a solução que mais se encaixa às suas necessidades e aos resultados desejados.

Perguntas Frequentes

Como funciona o Amazon Polly?

O Amazon Polly utiliza modelos de deep learning para sintetizar a fala. Ele converte a entrada de texto em áudio por meio de algoritmos avançados e redes neurais.

O Amazon Polly é gratuito para uso comercial?

Conteúdos criados no Amazon Polly já foram utilizados em vídeos do YouTube, sistemas de transmissão e outras plataformas de forma gratuita. Entretanto, é recomendável consultar as condições específicas do seu caso de uso para entender os requisitos comerciais.

Produza locuções, dublagens e clones com mais de 1.000 vozes em mais de 100 idiomas

Experimente grátis
studio banner faces

Compartilhe este artigo

Cliff Weitzman

Cliff Weitzman

CEO e fundador da Speechify

Cliff Weitzman é um defensor da causa da dislexia e o CEO e fundador da Speechify, o aplicativo número 1 de conversão de texto em fala do mundo, com mais de 100.000 avaliações 5 estrelas e líder de downloads na App Store na categoria Notícias & Revistas. Em 2017, Weitzman foi incluído na lista Forbes 30 under 30 por seu trabalho para tornar a internet mais acessível a pessoas com dificuldades de aprendizagem. Cliff Weitzman já foi destaque em veículos como EdSurge, Inc., PC Mag, Entrepreneur, Mashable, entre outros importantes meios de comunicação.

speechify logo

Sobre a Speechify

Leitor de texto para fala nº 1

Speechify é a principal plataforma de texto para fala do mundo, confiável por mais de 50 milhões de usuários e com mais de 500.000 avaliações cinco estrelas em suas versões para iOS, Android, extensão para Chrome, web app e aplicativos para Mac desktop. Em 2025, a Apple premiou a Speechify com o prestigiado Apple Design Award na WWDC, chamando-a de “um recurso essencial que ajuda as pessoas a viverem melhor”. A Speechify oferece mais de 1.000 vozes naturais em mais de 60 idiomas e é usada em quase 200 países. As vozes de celebridades incluem Snoop Dogg e Gwyneth Paltrow. Para criadores e empresas, o Speechify Studio oferece ferramentas avançadas, incluindo o Gerador de Voz IA, Clonagem de Voz IA, Dublagem de IA e seu próprio Alterador de Voz IA. A Speechify também integra grandes produtos com sua API de texto para fala de alta qualidade e custo acessível. Em destaque no The Wall Street Journal, CNBC, Forbes, TechCrunch e outros grandes veículos de mídia, a Speechify é a maior provedora de texto para fala do mundo. Visite speechify.com/news, speechify.com/blog e speechify.com/press para saber mais.