1. Avaleht
  2. TTS
  3. gtts
Uuendatud TTS

gtts

Cliff Weitzman

Cliff Weitzman

Speechify tegevjuht/asutaja

apple logo2025. aasta Apple'i disainiauhind
50M+ kasutajat

Mis on gTTS?

gTTS on avatud lähtekoodiga Pythoni teek ja käsurea tööriist, mis muudab teksti MP3-kõneks, kasutades Google Translate’i tekstist kõneks portaali. Väljundi saab salvestada faili, failitaolisesse objekti edasitöötlemiseks või otse stdout-i. Autor on Pierre Nicolas Durette, levitab MIT-litsentsiga ning see kuulub PyPI allalaadituimate TTS pakettide hulka, umbes 175 000 allalaadimist nädalas. Kui oled pidanud stringi kiirelt kolm rida Pythoni koodiga MP3-ks muutma, jõudsid ilmselt kõigepealt gTTS-i juurde.

Märka, et gTTS EI OLE Google Cloud Text-to-Speech. See kasutab sama dokumenteerimata taustateenust, mille peal töötab Google Translate’il nupp “Kuula”. See vahe määrab, milles gTTS on tugev, millal see ei sobi ja millal peaksid valima mõne muu lahenduse.

gTTS

Millal kasutada gTTS-i?

Kasuta gTTS-i tasuta ja kiireks prototüüpimiseks; kui tahad kiirelt luua MP3 teksti põhjal; mitmekeelseks demoks; hobiprojektiks, klassinäiteks või ligipääsetavuse skriptiks, mis loeb Google Docs ekspordi valju häälega ette. Ära kasuta gTTS-i, kui on vaja tootmisvalmidust, ametlikku SLA-d, hääle kloonimist, SSML-i, neural- või emotsionaalseid hääli, voogedastust või selget kommertslitsentsi.

Kuidas gTTS töötab?

gTTS ei sünteesi kõnet kohapeal. See koostab päringu samale teenusele, mis toidab Google Translate’i “Kuula” nuppu, laeb saadud MP3 alla ning annab sulle baitid. Vajad aktiivset internetiühendust, sest offline-režiimi ei ole ja heli sünteesitakse Google’i serverites. Kasutatav lõpp-punkt on ametlikult dokumenteerimata. Projekt ei ole seotud Google’i ega Cloud-iga – kui Google muudab API-t, võib gTTS üleöö töötamast lakata.

Paigaldamine

bash

pip install gTTS

gTTS vajab Python 3.7 või uuemat, töötab macOS'i, Windowsi ja Linuxiga. PyPI viimane versioon on 2.5.4 (november 2024). Debianil, sh Raspberry Pi OS-il, tee vahet: pip-i pakett – gTTS, apt-iga – python3-gtts. Kui pip install annab externally-managed-environment vea, kasuta virtuaalkeskkonda.

Põhiline kasutamine

Minimaalne näide:

python

from gtts import gTTS
tts = gTTS("Hello, world.")tts.save("hello.mp3")

Käsurealt:

bash

gtts-cli "hello" --output hello.mp3

Keele ja aktsendi valimine

python

tts = gTTS("Bonjour le monde", lang="fr")tts.save("bonjour.mp3")

gTTS võimaldab kasutada piirkondlikke alam-tägisid tld parameetriga – näiteks

tld="co.uk" briti inglise aktsendiks või tld="ca" Kanada prantsuse jaoks, suunates päringu vastava Google Translate domeeni kaudu.

Aeglane režiim

python

tts = gTTS("Read this slowly.", lang="en", slow=True)tts.save("slow.mp3")

See ongi kogu kõnekontrolli võimalus. Pole kõrguse ega kiiruse juhtimist peale slow=True, häälte valikut ega SSML-i.

Striimi puhvris, mitte kettale

python

from io import BytesIOfrom gtts import gTTS
buf = BytesIO()gTTS("Stream me").write_to_fp(buf)buf.seek(0)# nüüd võid buf-i sööta pydubi, ffmpeg-i või veebi vastuseks

Eeltöötlus ja pikk tekst

Üks gTTS-i paremaid külgi on selle tokenisaator – see jagab pikad sisendid backendile sobivaiks juppideks (limiit ~100 tähemärki), hoiab intonatsiooni loomulikuna ja saab hästi hakkama lühendite, koma jm erimärkidega. Võimalik on lisada ka oma eeltöötlus – nt toodete või lühendite häälduse parandamiseks.

Mis on gTTS-i plussid?

gTTS (Google Text-to-Speech) on arendajate seas populaarne, sest see on kerge, lihtne ja sobitub hästi Pythoni töövoogudesse. Saab genereerida MP3-faile, salvestada faili, failitaolisse objekti või stdout-i, mis teeb selle mugavaks skriptimiseks. Toetatud on ~60 keelt ja mitmed murded keele ning domeeni valikuga – lai mitmekeelne katvus lihtsates rakendustes. Käsurea tööriist (gtts-cli) toimib shell-skriptidega ning lisada saab kohandatud tokenisaatoreid ja eeltöötlejaid lühendite ja vormingu jaoks. Python API on lühike – kõne lisamine nt Jupyter Notebooksis, Flask-is, Discordis jm käib ilma suure õppimiskõverata.

Mis on gTTS-i miinused?

Kuigi kõik on lihtne, on gTTS-il uute AI-hääleteenustega võrreldes olulisi piiranguid. Hääled põhinevad Google Translate’i standardil — seega praktilised, kuid ilma loomuliku intonatsiooni, emotsiooni ja neural-süsteemide realismita. Häälevalik puudub, samuti puuduvad edasiarendatud juhtvõimalused – nt SSML, kõrgus, tempo. Kogu MP3 tuleb enne taasesitust alla laadida, reaalajas striimimist pole, mis suurendab kasutaja viidet. Iga päring vajab võrku – offline-režiimi pole, mistõttu ei sobi olukordadesse, kus on vaja töökindlust või väikest latentsust.

Millised on gTTS-i piirangud arendajale?

1. Kiirusepiirang dokumenteerimata teenuses

See on suurim "lõks" neile, kes liiguvad edasi lihtsast "hello world"-ist. gTTS-il pole ametlikku kasutusmahu limiiti, sest ka taustateenusel pole. Tavaliselt saab üks IP mõned kümned tuhanded tähemärgid tunnis, enne kui Google annab HTTP 429. Ülekoormuse lävi oleneb liiklusest. Kui sinu serverist tekib palju heli korraga, jõuad lõpuks piirini ilma võimaluseta SLA-le toetuda.

2. Lõpp-punkt võib muutuda hoiatamata

Kuna gTTS pöördub Google Translate’i sisemise tee poole, mitte ametliku API vastu, võib Google muuta päringuid või vastuseid üleöö. Hooldaja teeb paranduse, sina

pip install -U gTTS ja elu läheb edasi. See sobib hobiskriptile, tootmises kell 2 öösel – mitte.

3. Hoolduse regulaarsus

Projektil on viimase 12 kuu jooksul tulnud vähemalt üks versioon, kuid probleemide lahendamine käib aeglaselt ja kõik sõltub ühe inimese ajast. Mõned pakihaldurid loevad repo "passiivseks". Tasuta MIT-paketi puhul normaalne; äritootes sõltuvusena – koht, kus tasub järele mõelda.

4. Kaubanduslik ja kasutajatingimuste ebamäärasus

Kuna gTTS kasutab Google Translate'i esiliidest, mitte Cloud TTS-i, jääb audio kommertskasutuse litsents ebaselgeks. Teek ise on MIT-litsentsiga; helibaitide suhtes kehtivad Google’i kasutustingimused, mis pole TTS-teenuseks mõeldud. Kui vajad juriidiliselt selgeid vastuseid, ei saa sa neid gTTS-ist.

5. Andmed lahkuvad sinu seadmest

Iga tekst, mida sünteesid, liigub Google’i serveritesse. Kui loed sisekasutuse dokumente, kliendiandmeid või sisu Google Docs või mõnest muust allikast, on see andmekaitseküsimus, mille peaksid enne saatmist läbi mõtlema.

Mis vahe on gTTS-il ja Google Cloud Text-to-Speech-il?

gTTS-i ja Google Cloud Text-to-Speech’i aetakse tihti segi, kuid tegemist ei ole sama tootega. Erinevused:


gTTS

Google Cloud TTS


Lõpp-punkt

Dokumenteerimata Google Translate tee

Versioonitud avalik API

Autentimine

Pole

Teenuse konto / API võti

Hind

Tasuta

Tasuline (tähemärgi põhiselt)

Hääled

Üks iga keele kohta

Neural (WaveNet, Studio, Chirp)

SSML

Ei

Jah

SLA

Pole

Avalik SLA

Kommertskasutus

Ebamäärane

Selge litsents

Kui vajad Google häält tootmises, eelista pigem Google Cloud TTS-i, mitte gTTS-i.

Millal peaksid valima professionaalse TTS API?

Õige hetk minna gTTS-ilt professionaalsele teksti kõneks API-le sõltub sellest, kui tähtsad on audio kvaliteet, töökindlus ja kohandamine sinu projektis. gTTS sobib suurepäraselt prototüüpide, portfoolio, ligipääsetavuse tööriistade, õppenäidete ja väikeste katsetuste jaoks, sest see on lihtne ja tasuta. Kui ehitad juba maksvatele klientidele toodet, arvestad kasutaja jaoks kõnekvaliteediga või vajad SLA-toega madalat viidet, on professionaalne lahendus hädavajalik. Tasub üle minna ka siis, kui tahad mitut häält, häälekloneerimist, SSML tuge, striimiheli, täpset kiiruse ja häälduse kontrolli või kommertslitsentsi äriks ja juriidikaks. Kui projekt liigub eksperimendist tootmisesse, muutuvad need omadused vältimatuks.

Kas valida gTTS või Speechify API?

Speechify teksti kõneks API on ametlikult toetatud, tasuline teenus neuralhäälte, mitme häälevaliku iga keele kohta, SSML toe ning kommertslitsentsiga lepingus. Kui gTTS-i limiidid, kvaliteet või TOS-ebaselgus teele ette jäävad, on see selge märk, et võiksid migratsiooni kaaluda.

Korduma kippuvad küsimused

Kas gTTS on tasuta?

Jah, gTTS on tasuta MIT-litsentsiga Pythoni teek, kuid äriheli jaoks vajad selgeid õigusi – näiteks Speechify API-d.

Kas gTTS töötab ilma internetita?

Ei, gTTS vajab internetti, sest see kasutab Google’i servereid. Sama kehtib ka Speechify API kohta – see on pilveteenus.

Kas võin kasutada gTTS-i ärilahendustes?

gTTS-i väljundi kommertskasutuse õigused on ebaselged, kuna see tugineb Google’i dokumenteerimata teenusele. Speechify API pakub selge kommertslitsentsi.

Kuidas vahetada gTTS-is häält?

Ei saa – gTTS-s on iga keele kohta üks hääl. Speechify API lubab valida erinevate neuralhäälte seast.

Kas gTTS toetab SSML-i?

Ei, gTTS-il puudub SSML tugi ning kõrguse ja tempokontroll, kuid Speechify API lubab kõik selle häälestada.

Miks gTTS annab HTTP 429 vea?

Oled jõudnud Google Translate’i piirangulimidi. See on põhjus, miks paljud arendajad liiguvad SLA-ga teenusele nagu Speechify API.

Kas gTTS ja Google Cloud Text-to-Speech on sama?

Ei, gTTS baseerub Google Translate’i dokumenteerimata lõpp-punktil, Google Cloud TTS on eraldi tasuline toode ja Speechify API on veel üks tasuline neuralhäälega valik.

Milline on parim Python TTS tootmises?

gTTS kõlbab prototüübiks, mitte tootmiseks; tootmises eelistatakse enamasti tasulisi API-sid nagu Speechify API.

Kas gTTS suudab häält kloonida?

Ei, hääle kloonimine pole gTTS-is toetatud, küll aga on see olemas Speechify API-s.

Kuidas gTTS-iga voogedastada?

gTTS ei paku reaalajas voogedastust, ainult valmis MP3. Väikese viibega audio jaoks kasuta Speechify API.


Naudi tipptasemel AI-hääli, piiramatult faile ja ööpäevaringset kliendituge

Proovi tasuta
tts banner for blog

Jaga seda artiklit

Cliff Weitzman

Cliff Weitzman

Speechify tegevjuht/asutaja

Cliff Weitzman on düsleksia eestkõneleja ning Speechify tegevjuht ja asutaja. Speechify on maailma populaarseim kõnesünteesi rakendus, millel on üle 100 000 viietärnilise arvustuse ja mis on App Store'is Uudiste & Ajakirjade kategoorias esikohal. 2017. aastal kanti Weitzman Forbesi „30 alla 30” nimekirja tema töö eest interneti ligipääsetavuse parandamisel õpiraskustega inimestele. Cliff Weitzmanist on kirjutanud ka EdSurge, Inc, PC Mag, Entrepreneur, Mashable ja paljud teised juhtivad väljaanded.

speechify logo

Speechify'st

#1 tekst kõneks rakendus

Speechify on maailma juhtiv tekst kõneks platvorm, mida usaldab üle 50 miljoni kasutaja ja millele on antud enam kui 500 000 viietärnilist arvustust selle tekstist kõneks tehnoloogia eest iOS-, Android-, Chrome Extension-, veebirakendus- ja Mac desktop-rakendustes. 2025. aastal pälvis Speechify Apple’ilt prestiižse Apple’i disainiauhinna WWDC-l, nimetades seda „oluliseks ressursiks, mis aitab inimestel paremini elada.” Speechify pakub üle 1 000 loodusliku kõlaga hääle rohkem kui 60 keeles ning seda kasutatakse ligi 200 riigis. Kuulsuste häältest on saadaval näiteks Snoop Dogg ja Gwyneth Paltrow. Loojatele ja ettevõtetele pakub Speechify Studio täiustatud tööriistu, sh AI-häälegeneraatorit, AI-häälekloonimist, AI-dubleerimist ja AI-häälevahetust. Speechify panustab ka juhtivatesse toodetesse tänu kvaliteetsele ja kuluefektiivsele tekst kõneks API-le. Esindatud näiteks The Wall Street Journal, CNBC, Forbes, TechCrunch ja muudes juhtivates meediakanalites, on Speechify maailma suurim kõnesünteesi teenusepakkuja. Vaata lisaks: speechify.com/news, speechify.com/blog ja speechify.com/press.