1. Startpagina
  2. TTS
  3. gtts
Updated on TTS

gtts

Cliff Weitzman

Cliff Weitzman

CEO en oprichter van Speechify

apple logo2025 Apple Design Award
50M+ gebruikers

Wat is gTTS?

gTTS is een open source Python-bibliotheek en commandoregeltool die tekst omzet in gesproken MP3-audio door het text-to-speech-eindpunt van Google Translate aan te roepen. Je kunt de output opslaan in een bestand, doorgeven aan een bestand-achtig object voor verdere audiobewerking of direct naar stdout sturen. Het is gemaakt door Pierre Nicolas Durette, valt onder de MIT-licentie en is een van de meest gedownloade TTS-pakketten op PyPI met ca. 175.000 downloads per week. Als je ooit een string naar MP3 wilde omzetten in drie regels Python, is gTTS waarschijnlijk het eerste resultaat dat je tegenkwam.

Maar het is belangrijk om te weten dat gTTS niet hetzelfde is als Google Cloud Text-to-Speech. Het gebruikt hetzelfde niet-gedocumenteerde systeem achter de knop "Luisteren" in Google Translate. Dat bepaalt waar gTTS in uitblinkt, waar het tekortschiet en wanneer je beter naar iets anders kijkt.

gTTS

Wanneer gebruik je gTTS?

Gebruik gTTS voor gratis, snel prototypen; een one-liner om MP3's van tekst te maken; meertalige demo's; een hobbyproject, klassikaal voorbeeld of toegankelijkheidsscript dat een Google Docs-export voorleest. Gebruik gTTS niet als je productiebetrouwbaarheid, een gedocumenteerde SLA, stemklonen, SSML, neurale stemmen, streaming audio of duidelijke commerciële licenties nodig hebt.

Hoe werkt gTTS?

gTTS genereert geen spraak op je eigen computer. Het bouwt een verzoek naar het systeem achter de "Luisteren"-functie van Google Translate, downloadt het MP3-resultaat en geeft je de bytes. Je hebt dus een actieve internetverbinding nodig; er is geen offline-modus en de audio wordt op Google-servers gegenereerd. Het eindpunt is ook niet officieel. Het project heeft geen band met Google of Google Cloud, en wijzigingen van Google kunnen plotseling alles breken.

Installatie

bash

pip install gTTS

gTTS vereist Python 3.7 of hoger en werkt op macOS, Windows en Linux. De huidige PyPI-versie is 2.5.4 (november 2024). Op Debian-systemen, incl. Raspberry Pi OS, let op de hoofdletters: het pip-pakket is gTTS, via apt python3-gtts. Krijg je bij pip install een externally-managed-environment-fout? Installeer dan in een virtual environment.

Basisgebruik

Het kleinste werkende voorbeeld:

python

from gtts import gTTS
tts = gTTS("Hello, world.")tts.save("hello.mp3")

Via de commandoregel:

bash

gtts-cli "hello" --output hello.mp3

Taal en accent kiezen

python

tts = gTTS("Bonjour le monde", lang="fr")tts.save("bonjour.mp3")

gTTS biedt regionale sub-tags via de tld-parameter, bijvoorbeeld

tld="co.uk" voor Brits Engels of tld="ca" voor Canadees Frans, door het verzoek naar andere Google Translate-domeinen te sturen.

Slow-modus

python

tts = gTTS("Read this slowly.", lang="en", slow=True)tts.save("slow.mp3")

Dit is zo'n beetje alle instelbare spraakopties. Geen toonhoogte, geen snelheidsregelaar behalve slow=True, geen andere stemmen, geen SSML.

Streamen naar buffer in plaats van schijf

python

from io import BytesIOfrom gtts import gTTS
buf = BytesIO()gTTS("Stream me").write_to_fp(buf)buf.seek(0)# nu kun je buf doorsturen naar pydub, ffmpeg, webresponse, etc.

Pre-processing en lange tekst

Een sterke troef van gTTS is de tokenizer. Die splitst lange input in stukken die de backend aankan (maximaal ca. 100 tekens per verzoek), behoudt intonatie en verwerkt afkortingen, decimalen en andere leestekens. Je kunt ook eigen pre-processors toevoegen, bijvoorbeeld voor productnamen of afkortingen.

Wat zijn de voordelen van gTTS?

gTTS (Google Text-to-Speech) is populair bij ontwikkelaars omdat het lichtgewicht is, makkelijk te implementeren en goed in Python-workflows past. Het kan MP3-bestanden genereren en direct opslaan in bestanden, file-like objecten of stdout, wat handig is voor automatisering en scripts. Met ondersteuning voor ca. 60 talen en verschillende accenten via taal- en domeininstellingen is het breed inzetbaar. De CLI (gtts-cli) speelt goed samen met shellscripts, en tokenizers en preprocessors zijn aanpasbaar voor afkortingen, cijfers en tekstvervanging. De minimale Python API maakt het eenvoudig om spraak toe te voegen aan Jupyter notebooks, Flask-apps, Discord-bots en andere lichte projecten zonder lange leercurve.

Wat zijn de nadelen van gTTS?

Ondanks de eenvoud heeft gTTS duidelijke beperkingen t.o.v. moderne AI-spraakplatforms. De stemmen klinken functioneel maar missen realistische intonatie, emotie en natuurlijkheid zoals bij nieuwe neurale text-to-speech-systemen. Je kunt niet kiezen uit meerdere stemstijlen per taal, er zijn geen geavanceerde instellingen als SSML, toonhoogte of nauwkeurige snelheid. gTTS moet de volledige MP3 downloaden voor afspelen, geen streaming, dus hogere latency bij interactieve apps. Daarnaast werkt gTTS alleen online, want elke aanvraag gaat via internet, dus ongeschikt voor offline- of lage-latentie-scenario's.

Wat zijn de beperkingen van gTTS voor ontwikkelaars?

1. Rate limiting op een niet-gedocumenteerd eindpunt

Dit is het grootste struikelblok voorbij "hello world". gTTS publiceert geen quotum omdat de backend dat ook niet doet. In de praktijk kan één IP vaak tienduizenden tekens per uur versturen voordat Google HTTP 429 terugstuurt, met een bovengrens die varieert. Genereert je app audio voor veel gebruikers via één server, dan bots je vroeg of laat op die limiet—zonder SLA om op terug te vallen.

2. Het eindpunt kan elk moment veranderen

Omdat gTTS een interne Google Translate-route gebruikt i.p.v. een officiële API, kan Google door aanpassingen in requests of responses gTTS ineens breken. De beheerder pusht een fix, jij

pip install -U gTTS en je kunt weer verder. Prima voor hobby, maar niet voor een productie-omgeving midden in de nacht.

3. Onderhoudsfrequentie

Het project krijgt af en toe nog releases (minimaal eens per jaar), maar issue-opvolging is traag en er is feitelijk maar één beheerder. Sommige trackers noemen de repo "inactief". Voor een gratis MIT-library normaal, maar als kernonderdeel in een betaald product risicovoller.

4. Commerciële en TOS-onduidelijkheid

Omdat gTTS Google Translate gebruikt i.p.v. Google Cloud TTS, is de licentie van de audio voor commercieel gebruik nergens duidelijk beschreven. De library is MIT-gelicentieerd, maar de gegenereerde audio valt onder de Google-dienstenvoorwaarden. Je legal-team krijgt dus geen helder antwoord van gTTS.

5. Gevoelige data verlaat je computer

Elke string die je omzet, wordt naar Google-servers gestuurd. Spreek je interne documenten in, klantgegevens of info uit Google Docs en andere kennisbronnen, dan is dat een datavraag die je moet beantwoorden voor je live gaat.

Wat is het verschil tussen gTTS en Google Cloud Text-to-Speech?

Hoewel gTTS en Google Cloud Text-to-Speech vaak door elkaar worden gehaald, zijn ze verschillend. De verschillen:


gTTS

Google Cloud TTS


Endpoint

Niet-gedocumenteerde Google Translate-route

Gedocumenteerde publieke API

Auth

Geen

Serviceaccount / API-sleutel

Kosten

Gratis

Betaald (per teken)

Stemmen

Eén per taal

Neuraal (WaveNet, Studio, Chirp)

SSML

Nee

Ja

SLA

Geen

Officiële SLA

Commercieel gebruik

Onduidelijk

Expliciet gelicenseerd

Heb je de Google Voice nodig in productie, dan wil je vrijwel altijd Google Cloud TTS, niet gTTS.

Wanneer overstappen op een professionele TTS API?

Het juiste moment om van gTTS naar een professionele text-to-speech API over te stappen, hangt af van hoe belangrijk audiokwaliteit, betrouwbaarheid en maatwerk zijn voor je project. gTTS werkt goed voor prototypen, portfolio, persoonlijke toegankelijkheid, educatieve demo's en lichte experimenten omdat het simpel en gratis is. Maar zodra je product betaald wordt, spraakkwaliteit belangrijk wordt of voorspelbare latency/SLA nodig is, is een professionele oplossing beter. Ook bij behoefte aan extra functies (meer stemmen, stemklonen, SSML, streaming, nauwkeurige controle of duidelijke commerciële licenties) is upgraden logisch. Naarmate projecten serieuzer worden, zijn dit soort features geen luxe meer maar noodzaak.

Kies je voor gTTS of Speechify’s API?

Speechify's text-to-speech API is een officiële, betaalde dienst met neurale stemmen, meerdere stemopties per taal, SSML en commerciële licenties in het contract, geen wrapper rond een niet-gedocumenteerd eindpunt. Worden de limieten, stemkwaliteit of TOS-onduidelijkheid van gTTS een obstakel, dan is dit het moment om de overstap te overwegen.

FAQ

Is gTTS gratis te gebruiken?

Ja, gTTS is gratis en MIT-gelicentieerd, maar voor commerciële, gelicentieerde audio heb je een betaalde dienst zoals de Speechify API nodig.

Werkt gTTS offline?

Nee, gTTS heeft een internetverbinding nodig, want het praat met Google’s servers, net als de Speechify API (cloudservice).

Mag ik gTTS gebruiken in een commercieel product?

De licentie voor gTTS-output bij commercieel gebruik is onduidelijk doordat het een niet-officieel Google-eindpunt gebruikt. De Speechify API biedt wel expliciete commerciële licenties.

Hoe verander ik stemmen in gTTS?

Niet echt mogelijk. gTTS biedt één stem per taal; de Speechify API biedt een catalogus van neurale stemmen.

Ondersteunt gTTS SSML?

Nee, gTTS heeft geen SSML, toonhoogte- of snelheidsregeling. De Speechify API ondersteunt SSML wel voor volledige prosodiecontrole.

Waarom geeft gTTS HTTP 429-fouten?

Je hebt het niet-officiële limiet van Google Translate bereikt, een veelvoorkomende reden waarom devs overstappen op een dienst met een echte SLA zoals de Speechify API.

Is gTTS hetzelfde als Google Cloud Text-to-Speech?

Nee, gTTS gebruikt een niet-officieel eindpunt van Google Translate, Google Cloud TTS is een apart betaald product en de Speechify API is een andere betaalde optie met neurale stemmen.

Wat is de beste Python TTS-library voor productie?

gTTS is prima voor prototypes, maar niet voor productie; voor productie kiezen developers meestal een betaalde API zoals de Speechify API.

Kan gTTS een stem klonen?

Nee, stemklonen werkt niet via gTTS, maar wel met de Speechify API.

Hoe stream ik audio met gTTS?

gTTS ondersteunt geen real-time streaming, maar geeft een complete MP3 terug. Gebruik voor echte streaming de Speechify API.


Profiteer van de meest geavanceerde AI-stemmen, onbeperkte bestanden en 24/7 ondersteuning

Probeer gratis
tts banner for blog

Deel dit artikel

Cliff Weitzman

Cliff Weitzman

CEO en oprichter van Speechify

Cliff Weitzman zet zich in voor mensen met dyslexie en is de CEO en oprichter van Speechify, de nummer 1-tekst-naar-spraakapp ter wereld met meer dan 100.000 5-sterrenbeoordelingen, die in de App Store op nummer 1 staat in de categorie Nieuws & Tijdschriften. In 2017 werd Weitzman opgenomen in de Forbes 30 Under 30-lijst voor zijn inzet om het internet toegankelijker te maken voor mensen met een leerstoornis. Weitzman werd onder meer uitgelicht in EdSurge, Inc., PCMag, Entrepreneur en Mashable.

speechify logo

Over Speechify

#1 tekst-naar-spraaklezer

Speechify is het toonaangevende tekst-naar-spraakplatform ter wereld, vertrouwd door meer dan 50 miljoen gebruikers en bekroond met meer dan 500.000 vijfsterrenbeoordelingen voor zijn tekst-naar-spraak iOS-, Android-, Chrome-extensie-, webapp- en Mac-desktopapps. In 2025 bekroonde Apple Speechify met de prestigieuze Apple Design Award tijdens WWDC en noemde het “een onmisbare bron die mensen helpt hun leven te leiden.” Speechify biedt 1.000+ natuurlijk klinkende stemmen in meer dan 60 talen, gebruikt in bijna 200 landen. Beroemdhedenstemmen zijn onder meer Snoop Dogg en Gwyneth Paltrow. Voor makers en bedrijven biedt Speechify Studio geavanceerde tools, waaronder de AI Voice Generator, AI-stemkloning, AI-nasynchronisatie en de AI Voice Changer. Speechify levert ook hoogwaardige, kosteneffectieve tekst-naar-spraak-API’s aan toonaangevende producten. Gepubliceerd in The Wall Street Journal, CNBC, Forbes, TechCrunch en andere toonaangevende nieuwsbronnen. Speechify is de grootste tekst-naar-spraakleverancier ter wereld. Bezoek speechify.com/news, speechify.com/blog en speechify.com/press voor meer informatie.