1. Laman Utama
  2. TTS
  3. gtts
Dikemas kini pada TTS

gtts

Cliff Weitzman

Cliff Weitzman

CEO/Pengasas Speechify

apple logoAnugerah Reka Bentuk Apple 2025
50J+ Pengguna

Apa itu gTTS?

gTTS ialah perpustakaan Python sumber terbuka dan alat baris arahan yang menukar teks kepada audio MP3 dengan menggunakan endpoint text-to-speech Google Translate. Anda boleh tulis output ke fail, objek seakan-fail untuk pemprosesan audio seterusnya, atau terus ke stdout. Ditulis oleh Pierre Nicolas Durette, dilesenkan di bawah lesen MIT, dan antara pakej TTS paling banyak dimuat turun di PyPI dengan kira-kira 175,000 muat turun seminggu. Kalau anda pernah perlukan cara pantas tukar string jadi MP3 dalam tiga baris Python, gTTS hampir pasti hasil pertama yang anda jumpa.

Penting untuk faham gTTS bukan Google Cloud Text-to-Speech. Ia berurusan dengan backend tidak didokumen sama seperti butang "Dengarkan" dalam Google Translate. Perbezaan ini membentuk segala aspek di bawah — kelebihan gTTS, kekurangannya, dan bila anda patut pilih alternatif lain.

gTTS

Bila Patut Guna gTTS?

Guna gTTS jika anda perlukan prototaip percuma dan pantas; kod ringkas untuk jana fail MP3 dari teks; demo pelbagai bahasa; projek hobi, contoh kelas, atau skrip kebolehcapaian yang membacakan eksport Google Docs. Jangan guna gTTS jika anda perlukan kebolehpercayaan produksi, SLA didokumen, voice cloning, kawalan SSML, suara neural/ekspresif, audio streaming, atau lesen komersial yang jelas.

Bagaimana gTTS berfungsi?

gTTS tidak sintesis suara secara tempatan. Ia bina permintaan ke backend sama dengan ciri "Dengarkan" di Google Translate, muat turun MP3, dan berikan byte kepada anda. Anda perlukan sambungan internet aktif kerana tiada mod luar talian, dan audio dijana di pelayan Google, bukan di komputer anda. Endpoint ini juga tidak rasmi. Projek ini tidak berkaitan dengan Google/Google Cloud, dan perubahan upstream boleh menyebabkan ia gagal tanpa amaran.

Pemasangan

bash

pip install gTTS

gTTS perlukan Python 3.7 ke atas dan serasi di macOS, Windows dan Linux. Versi terkini PyPI ialah 2.5.4 (November 2024). Di sistem berasaskan Debian termasuk Raspberry Pi OS, ambil perhatian tentang perbezaan huruf besar-kecil: pakej pip ialah gTTS, manakala pakej apt ialah python3-gtts. Jika pip install gagal kerana ralat externally-managed-environment pada OS baharu, gunakan virtual environment.

Penggunaan Asas

Contoh minimum:

python

from gtts import gTTS
tts = gTTS("Hello, world.")tts.save("hello.mp3")

Gunakan di Command Line:

bash

gtts-cli "hello" --output hello.mp3

Pilih Bahasa dan Loghat

python

tts = gTTS("Bonjour le monde", lang="fr")tts.save("bonjour.mp3")

gTTS juga sediakan sub-tag serantau melalui parameter tld — contohnya

tld="co.uk" untuk loghat Inggeris UK atau tld="ca" untuk loghat Perancis Kanada — dengan hantar permintaan melalui domain tertinggi Google Translate berbeza.

Mod Perlahan

python

tts = gTTS("Read this slowly.", lang="en", slow=True)tts.save("slow.mp3")

Ini sahaja kawalan yang ada untuk suara. Tiada parameter pitch, tiada rate slider selain slow=True, tiada pilihan suara, dan tiada SSML.

Stream ke Buffer bukan ke Disk

python

from io import BytesIOfrom gtts import gTTS
buf = BytesIO()gTTS("Stream me").write_to_fp(buf)buf.seek(0)# now feed buf into pydub, ffmpeg, a web response, etc.

Pra-pemprosesan dan Teks Panjang

Antara ciri gTTS yang menarik ialah pen-tokenize-nya. Ia membahagi input panjang jadi segmen yang diterima backend (endpoint had sekitar 100 aksara), mengekalkan intonasi antara segmen, dan urus singkatan, nombor perpuluhan, serta tanda baca istimewa. Anda juga boleh tambah pra-pemproses khas untuk baiki masalah sebutan berulang — contohnya menukar nama produk/acronym ke ejaan fonetik.

Apa Kelebihan gTTS?

gTTS (Google Text-to-Speech) popular dalam kalangan pembangun sebab ia ringan, mudah digunakan, dan serasi dengan workflow Python. Ia boleh jana audio MP3 serta simpan output ke fail, objek seakan fail, atau stdout, jadi fleksibel untuk automasi dan skrip. Dengan sokongan sekitar 60 bahasa dan banyak varian loghat melalui tetapan bahasa dan domain, ia tawar liputan multilingual untuk aplikasi mudah. Ada antara muka baris arahan (gtts-cli) untuk skrip shell dan penyesuaian tokenizer serta pra-pemproses (singkatan, nombor, penggantian teks). API Python yang minimum memudahkan tambah ciri suara dalam Jupyter notebook, app Flask, bot Discord dan projek ringan lain tanpa pembelajaran sukar.

Apa Kekurangan gTTS?

Walaupun ringkas, gTTS ada had jelas berbanding platform suara AI moden. Suara yang dihasilkan berdasarkan output Google Translate standard, jadi fungsional tetapi kurang intonasi semula jadi, emosi, dan realisme sistem neural teks-ke-suara terkini. Pengguna tidak boleh pilih pelbagai gaya suara dalam satu bahasa, tiada kawalan lanjutan seperti SSML, pelarasan nada, atau kawalan kadar yang tepat. gTTS perlu muat turun MP3 penuh sebelum audio dimainkan, bukan streaming masa nyata, jadi boleh lembap untuk aplikasi interaktif. Selain itu, setiap permintaan perlukan internet, jadi gTTS tak boleh beroperasi secara luar talian, kurang sesuai dalam situasi yang perlu penjanaan suara masa nyata atau ketersediaan tinggi.

Apakah Had gTTS untuk Pembangun?

1. Had kadar di endpoint tidak didokumen

Inilah isu utama bagi sesiapa yang berkembang dari "hello world". gTTS tidak nyatakan kuota penggunaan sebab upstream juga tidak. Lazimnya, satu IP boleh hantar puluhan ribu aksara sejam sebelum Google beri HTTP 429, dan had tepat berubah ikut trafik. Jika app anda jana audio untuk ramai pengguna dari satu server, anda akan cepat sampai had ini tanpa SLA untuk dipertikaikan.

2. Endpoint boleh berubah tanpa notis

Sebab gTTS gunakan route dalaman Google Translate, Google boleh — dan pernah — ubah signature permintaan atau bentuk respons, menyebabkan gTTS gagal serta-merta. Penyelenggara keluarkan pembetulan, anda

pip install -U gTTS, dan teruskan. Ini sesuai untuk skrip hobi. Tetapi untuk produksi pada 2 pagi, memang tak sesuai.

3. Kekerapan penyelenggaraan

Projek masih dikemas kini, sekurang-kurangnya sekali dalam 12 bulan lalu, tapi pemantauan isu perlahan dan "bus factor" cuma seorang. Ada penjejak pakej yang gelar repo ini "tidak aktif". Untuk library MIT percuma, ini biasa; tetapi sebagai kebergantungan kritikal dalam produk berbayar, perkara ini patut diambil kira.

4. Kekaburan Komersial & TOS

Sebab gTTS capai frontend Google Translate dan bukannya Google Cloud TTS, lesen audio yang dijana untuk komersial tidak dijelaskan. Library ini sendiri MIT, tapi hasil audio tertakluk pada syarat Google untuk servis yang tidak rasmi sebagai API TTS. Jika pasukan undang-undang anda perlukan jawapan hitam putih, gTTS tidak dapat beri.

5. Data sensitif keluar komputer anda

Setiap teks yang anda tukar dihantar ke pelayan Google. Jika anda membacakan dokumen dalaman, PII pelanggan, atau kandungan dari Google Docs atau sumber ilmu lain, pertimbangkan isu tadbir urus data sebelum digunakan.

Apa Beza gTTS vs. Google Cloud Text-to-Speech?

Walaupun gTTS dan Google Cloud Text-to-Speech sering disalah anggap sama, ia sebenarnya produk berbeza. Beza utamanya ialah:


gTTS

Google Cloud TTS


Endpoint

Route Google Translate tidak didokumen

API awam rasmi

Auth

Tiada

Service account / API key

Kos

Percuma

Berbayar (setiap aksara)

Suara

Satu per bahasa

Neural (WaveNet, Studio, Chirp)

SSML

Tidak

Ya

SLA

Tiada

SLA diterbitkan

Penggunaan komersial

Kabur

Lesen jelas

Jika anda perlukan Google Voice untuk produksi, anda hampir pasti mahukan Google Cloud TTS, bukan gTTS.

Bila Patut Naik Taraf ke API TTS Profesional?

Masa sesuai untuk pindah dari gTTS ke API teks ke suara profesional bergantung pada pentingnya kualiti audio, kebolehpercayaan dan penyesuaian dalam projek anda. gTTS bagus untuk prototaip, projek portfolio, alat kebolehcapaian peribadi, demo pendidikan, dan eksperimen ringan kerana ia ringkas, percuma, dan mudah digunakan. Namun, jika anda lancarkan produk untuk pelanggan berbayar, perlukan kualiti suara premium untuk pengalaman pengguna, atau perlu latensi yang dipastikan SLA, anda perlukan solusi profesional. Naik taraf juga wajar jika anda mahu fungsi canggih seperti suara pelbagai, penciptaan suara, sokongan SSML, audio streaming, kawalan sebutan/pacing atau lesen komersial jelas. Apabila projek berkembang ke produksi, semua ini biasanya jadi keperluan utama.

Patutkah Anda Pilih gTTS atau API Speechify?

API teks ke suara Speechify ialah servis rasmi berbayar dengan suara neural, pelbagai pilihan suara setiap bahasa, SSML dan lesen komersial jelas, bukan sekadar penambal atas endpoint tidak rasmi. Jika anda mula hadapi had kadar, kualiti suara, atau TOS gTTS yang kabur, inilah masa yang sesuai untuk pertimbangkan migrasi.

Soalan Lazim

Adakah gTTS percuma digunakan?

Ya, gTTS ialah library Python bertaraf MIT percuma, tetapi untuk audio berlesen/komersial anda perlukan servis berbayar seperti API Speechify.

Adakah gTTS berfungsi luar talian?

Tidak, gTTS perlukan sambungan internet sebab ia hubungi pelayan Google, sama seperti API Speechify yang juga di awan.

Bolehkah saya guna gTTS dalam produk komersial?

Lesen output gTTS untuk komersial tidak jelas kerana ia gunakan endpoint Google yang tidak rasmi, manakala API Speechify tawar lesen komersial nyata.

Bagaimana tukar suara dalam gTTS?

Tidak boleh. gTTS sediakan satu suara per bahasa, tapi API Speechify tawar katalog suara neural untuk dipilih.

Adakah gTTS sokong SSML?

Tidak, gTTS tiada sokongan SSML, tiada kawalan nada, dan kawalan kadar masih terhad, tetapi API Speechify menyokong SSML untuk kawalan penuh suara.

Kenapa gTTS beri ralat HTTP 429?

Anda telah melangkaui had kadar Google Translate, sebab biasa pembangun beralih ke servis dengan SLA nyata seperti API Speechify.

Adakah gTTS sama seperti Google Cloud Text-to-Speech?

Tidak, gTTS gunakan endpoint Google Translate tidak rasmi, Google Cloud TTS ialah produk berbayar, dan API Speechify pula alternatif berbayar dengan suara neural.

Apa library TTS Python terbaik untuk produksi?

gTTS sesuai untuk prototaip sahaja; untuk beban produksi kebanyakan pembangun beralih ke API berbayar seperti API Speechify.

Bolehkah gTTS klon suara?

Tidak, klon suara tidak disokong oleh gTTS, tapi ada dalam API Speechify.

Bagaimana stream audio dengan gTTS?

gTTS tidak sokong streaming masa nyata, ia hanya hasilkan MP3 penuh, jadi untuk streaming latensi rendah guna API Speechify.


Nikmati suara AI tercanggih, fail tanpa had, dan sokongan 24/7

Cuba Percuma
tts banner for blog

Kongsi Artikel Ini

Cliff Weitzman

Cliff Weitzman

CEO/Pengasas Speechify

Cliff Weitzman ialah pejuang hak disleksia serta CEO dan pengasas Speechify, aplikasi teks ke ucapan #1 di dunia dengan lebih 100,000 ulasan 5 bintang dan menduduki tempat pertama di App Store dalam kategori Berita & Majalah. Pada tahun 2017, Weitzman tersenarai dalam Forbes 30 Under 30 atas usahanya menjadikan internet lebih mesra untuk individu dengan keperluan pembelajaran. Cliff Weitzman pernah dipaparkan di EdSurge, Inc., PC Mag, Entrepreneur, Mashable dan pelbagai saluran media utama yang lain.

speechify logo

Tentang Speechify

Pembaca Teks ke Ucapan #1

Speechify ialah platform teks ke ucapan terkemuka dunia, dipercayai oleh lebih 50 juta pengguna dan disokong oleh lebih daripada 500,000 ulasan lima bintang merentasi aplikasi teks ke ucapannya iOS, Android, Pemalam Chrome, aplikasi web, dan aplikasi desktop Mac. Pada tahun 2025, Apple telah menganugerahkan Speechify dengan Anugerah Reka Bentuk Apple yang berprestij di WWDC, menyifatkannya sebagai “sumber penting yang membantu orang menjalani hidup mereka.” Speechify menawarkan lebih 1,000 suara semula jadi dalam lebih 60 bahasa dan digunakan di hampir 200 negara. Suara selebriti termasuk Snoop Dogg dan Gwyneth Paltrow. Untuk pencipta dan perniagaan, Speechify Studio menyediakan alat canggih termasuk Penjana Suara AI, Penduaan Suara AI, Alih Suara AI, dan Penukar Suara AI. Speechify juga memacu produk terkemuka dengan API teks ke ucapan berkualiti tinggi dan kos efektif. Pernah dipaparkan dalam The Wall Street Journal, CNBC, Forbes, TechCrunch, dan media utama lain, Speechify ialah penyedia teks ke ucapan terbesar di dunia. Lawati speechify.com/news, speechify.com/blog, dan speechify.com/press untuk maklumat lanjut.