1. Beranda
  2. API
  3. Bagaimana Speechify Text to Speech API Mendukung SSML
Dipublikasikan pada API

Bagaimana Speechify Text to Speech API Mendukung SSML

Cliff Weitzman

Cliff Weitzman

CEO/Pendiri Speechify

Speechify API menghadirkan latensi 300 ms, suara seperti manusia, dan 50+ bahasa

apple logoApple Design Award 2025
50J+ pengguna

Speechify Text to Speech (TTS) API berada di garis depan teknologi suara yang dapat disesuaikan, menawarkan dukungan kuat untuk Speech Synthesis Markup Language (SSML). Fitur canggih ini memungkinkan developer menciptakan suara yang sangat terpersonalisasi langsung lewat kode, sehingga penyampaian teks punya intonasi, ritme, dan emosi yang lebih presisi. Di artikel ini, kami mengulas bagaimana Speechify Text to Speech API memanfaatkan SSML untuk mengubah teks biasa jadi suara digital yang ekspresif dan alami, membantu beragam aplikasi menghadirkan pengalaman yang lebih hidup dan menarik bagi pengguna.

Sekilas Speechify Text to Speech API

Speechify Text to Speech API adalah alat tangguh untuk mengubah teks menjadi suara nyata. Dengan neural network dan teknik machine learning canggih, API ini menghasilkan suara yang terdengar alami dan enak didengar. Mendukung banyak bahasa dan dialek dengan beragam opsi suara pria dan wanita, sehingga cocok untuk berbagai jenis pengguna. Fleksibilitas ini menjadikan Speechify Text to Speech API pilihan ideal bagi developer yang ingin mengintegrasikan kemampuan text-to-speech ke aplikasi, situs, atau layanan interaktif lain demi pengalaman pengguna yang lebih inklusif.

Apa itu SSML?

Speech Synthesis Markup Language (SSML) adalah bahasa markup berbasis XML yang digunakan developer untuk mengatur bagaimana sistem text to speech mengubah teks jadi suara. SSML memungkinkan pengaturan aspek ucapan seperti nada, kecepatan, volume, dan pelafalan, sehingga hasil suara terdengar lebih manusiawi. Teknologi ini sangat berguna untuk konten edukasi, respon interaktif, atau storytelling, di mana intonasi dan nuansa sangat penting agar pesan tersampaikan dengan efektif.

Peran SSML dalam Meningkatkan Text to Speech

Integrasi SSML meningkatkan teknologi text to speech dengan memberi alat untuk mengatur ucapan secara detail, yang sebelumnya tidak mungkin di sistem text to speech dasar. SSML mendukung alur dialog yang lebih natural dan menyesuaikan keluaran suara sesuai konteks, misalnya menambah jeda untuk efek dramatis atau mengubah kecepatan bicara sesuai kebutuhan. Peran SSML pada text to speech menjembatani jarak antara suara manusia dan komputer, sehingga interaksi digital lebih mudah dipahami dan terasa alami.

Bagaimana Speechify Mendukung SSML

Speechify Text to Speech API berkomitmen menghadirkan pengalaman suara terbaik dan mendukung SSML untuk memperkaya proses konversi text to speech. Dengan SSML, Speechify memungkinkan developer menyempurnakan keluaran audio sesuai kebutuhan spesifik. Dukungan ini mencakup pengaturan dinamika suara seperti intonasi dan tekanan yang penting untuk menyampaikan emosi dan maksud. Speechify Text to Speech API’s SSML memastikan pengguna akhir mendapat pengalaman mendengarkan yang optimal sehingga aplikasi terasa lebih menarik dan bermanfaat.

Keuntungan Menggunakan SSML di Speechify

Menggunakan SSML bersama Speechify Text to Speech API punya banyak keuntungan, antara lain:

  • Kustomisasi: SSML mengatur suara sesuai kebutuhan aplikasi sehingga pengalaman pengguna lebih personal.
  • Keterlibatan Pengguna: SSML membuat interaksi suara jadi lebih dinamis, jelas, dan nyaman di telinga.
  • Peningkatan Aksesibilitas: SSML dengan text to speech membuat teknologi lebih mudah diakses semua orang, terutama penyandang disabilitas.
  • Efektivitas Lebih Tinggi: SSML meningkatkan komunikasi saat kualitas suara sangat krusial.

Dasar-dasar SSML di Speechify Text to Speech API 

Speechify Text to Speech API menggunakan Speech Synthesis Markup Language untuk mengatur dan memperkaya suara digital, membuat interaksi digital terdengar lebih alami. Dengan menguasai teknik SSML, Anda bisa meningkatkan ekspresi dan efektivitas aplikasi text to speech Anda. Baik untuk aksesibilitas, hiburan, maupun edukasi, SSML menyediakan alat agar suara digital terdengar lebih manusiawi. Berikut dasar-dasarnya:

Karakter Escaped di SSML

Agar kode SSML bisa dibaca parser dengan benar, beberapa karakter khusus harus di-escape supaya tidak keliru dibaca sebagai markup. Berikut karakter umum dan escape-nya:

  • Ampersand (&) jadi &
  • Greater-than (>) jadi >
  • Less-than (<) jadi &lt;
  • Tanda kutip ganda (") jadi &quot;
  • Apostrof (') jadi &apos;

Contoh: Mengonversi baris dengan karakter khusus:

const escapeSSMLChars = (text: string) =>

  text

    .replaceAll('&', '&amp;')

    .replaceAll('<', '&lt;')

    .replaceAll('>', '&gt;')

    .replaceAll('"', '&quot;')

    .replaceAll('\'', '&apos;')

Misal, mengubah teks: Some "text" with 5 < 6 & 4 > 8 menghasilkan: <speak>Some &quot;text&quot; with 5 &lt; 6 &amp; 4 &gt; 8 in it</speak>

Ekspresivitas Suara

SSML memungkinkan pengaturan pitch, rate, dan volume suara agar hasil lebih kaya:

  1. Pitch: Atur nada suara dari sangat rendah (x-low) ke sangat tinggi (x-high), atau persentase spesifik sesuai kebutuhan.
  2. Rate: Ubah kecepatan bicara, dari sangat lambat (x-slow) ke sangat cepat (x-fast), atau atur persentasenya.
  3. Volume: Atur volume dari diam sampai ekstra keras (x-loud), atau sesuaikan dengan desibel maupun persen.

Contoh:

<speak>

    Ini pola ucapan normal.

    <prosody pitch="high" rate="fast" volume="+20%">

        Saya bicara lebih tinggi, lebih cepat, dan lebih keras!

    </prosody>

    Kembali ke ucapan normal.

</speak>

Jeda dan Penekanan Suara

Tag SSML seperti <break> dan <emphasis> penting agar suara terdengar natural dan ekspresif:

  • Break: Sisipkan jeda sesuai durasi atau kekuatan untuk menegaskan poin atau memisahkan bagian ucapan.
  • Penekanan: Tingkatkan atau kurangi tekanan pada kata untuk ekspresi ataupun penekanan pesan, sehingga pendengar lebih terlibat.

<speak>

    Kadang perlu jeda lebih lama di akhir kalimat.

    <break strength="medium" />

    Atau <break time="100ms" /> kadang di <break time="1s" /> tengah kalimat.

</speak>

Kontrol Suara Lanjutan

Speechify juga punya tag khusus <speechify:style> untuk mengatur emosi dan irama suara agar lebih ekspresif dan mudah dipahami.

Contoh:

<speak>

    <speechify:style emotion="angry" cadence="fast">

        Berapa kali kamu harus tanya ini?

    </speechify:style>

</speak>

Mengimplementasikan SSML di Speechify

Developer dapat menerapkan SSML di API Speechify dengan langkah-langkah berikut:

  1. Pengaturan Lingkungan: Konfigurasikan environment dev untuk mendukung HTTP.
  2. API Authentication: Dapatkan API key Speechify dan masukkan di header request.
  3. Susun Konten SSML: Tulis skrip SSML sesuai kebutuhan suara aplikasi Anda.
  4. Kirim Request: Sertakan skrip SSML di POST request dan kirim ke endpoint Speechify API.
  5. Proses Respons: Ambil dan olah output audio agar sesuai standar aplikasi Anda.

Use Case SSML di Speechify Text to Speech API

Speechify Text to Speech API’s SSML sangat penting untuk menyesuaikan suara dengan kebutuhan dan konteks berbeda, sehingga mengubah pengalaman suara digital. Berikut beberapa contoh penggunaan SSML lewat API Speechify di berbagai aplikasi:

  1. Aksesibilitas: SSML krusial untuk teknologi aksesibel bagi tunanetra atau kesulitan membaca.
  2. Platform E-learning: SSML membuat konten belajar lebih menarik lewat suara variatif dan penekanan tertentu.
  3. Virtual Assistant: SSML membuat interaksi digital terasa makin manusiawi, sehingga kepuasan pengguna meningkat.
  4. Audiobook: SSML memberi suara dan emosi berbeda di dalam cerita.
  5. Customer Service Bot: SSML menghadirkan percakapan lebih jelas dan ramah ke pelanggan, mengurangi salah paham dan meningkatkan kualitas layanan.
  6. Alat Pembelajaran Bahasa: SSML menonjolkan pelafalan untuk latihan listening.
  7. Pengumuman Publik: SSML memastikan info terdengar jelas di keramaian.
  8. Game: SSML menambah karakter dan kedalaman dialog.
  9. Pembuatan Podcast: SSML memudahkan pembuatan konten audio yang beragam dan menarik.
  10. Komunikasi Kesehatan: SSML menyampaikan info medis dengan suara yang menenangkan pasien.
  11. Navigasi: SSML menambah kejelasan dan penekanan pada instruksi penting.
  12. Sistem Telepon: SSML membuat IVR terdengar lebih natural.
  13. Presentasi Multimedia: SSML memberi narasi yang terdengar profesional.
  14. Smart Home: SSML menghadirkan respon suara yang lebih responsif dan intuitif.

Tips SSML Terbaik untuk Developer 

Baik Anda membuat IVR, audiobook, atau virtual assistant, memahami penggunaan SSML dapat meningkatkan kualitas proyek sintesis suara Anda. Berikut beberapa tips terbaik bagi developer:

  • Eksperimen dengan berbagai tag SSML untuk menemukan pengaturan optimal bagi use case Anda.
  • Perbarui dan perbaiki skrip SSML secara berkala berdasarkan feedback pengguna untuk kualitas audio yang lebih baik.
  • Pastikan tag SSML tertata rapi dan mengikuti standar XML agar tidak menimbulkan error.

Kesimpulan

Dengan dukungan fitur SSML, Speechify memungkinkan developer menciptakan pengalaman suara digital yang lebih manusiawi di berbagai aplikasi. Baik lewat pengaturan nada, kecepatan, volume, maupun tag canggih untuk ekspresi dan ritme, API ini memastikan setiap kata benar-benar terdengar dan terasa. Integrasi SSML dalam teknologi TTS Speechify memperluas pemanfaatan suara digital dan memperkuat aksesibilitas konten, menjadikannya alat inovasi penting bagi developer aplikasi suara.

FAQ

Apakah Speechify Text to Speech API mendukung SSML?

Ya, Speechify Text to Speech API sepenuhnya mendukung Speech Synthesis Markup Language (SSML) untuk meningkatkan ekspresi dan kustomisasi suara keluarannya.

Singkatan SSML itu apa? 

SSML singkatan dari Speech Synthesis Markup Language, yaitu bahasa markup standar bagi developer untuk mengontrol suara sintesis seperti nada, kecepatan, dan intonasi.

Apa manfaat SSML untuk text to speech?

SSML bermanfaat untuk text to speech dengan memberi kendali presisi atas suara sehingga hasilnya lebih alami dan bisa disesuaikan dengan kebutuhan pengguna.

Mengapa SSML penting?

Pentingnya SSML ada pada kemampuannya memberi kontrol detail pada suara buatan, sehingga kualitas komunikasi lisan digital lebih jelas, menarik, dan mudah dipahami untuk berbagai aplikasi.

Di mana saya bisa belajar lebih jauh tentang SSML Speechify?

Anda dapat mempelajari lebih lanjut Speechify Text to Speech API’s SSML dan cara penerapannya di dokumentasi resmi Speechify API di situs mereka.

Akses suara-suara favorit Speechify lewat API yang cepat, skalabel, dan ramah pengembang

Dapatkan akses API
api access banner

Bagikan artikel ini

Cliff Weitzman

Cliff Weitzman

CEO/Pendiri Speechify

Cliff Weitzman adalah advokat disleksia, sekaligus CEO dan pendiri Speechify, aplikasi text-to-speech nomor 1 di dunia dengan lebih dari 100.000 ulasan bintang 5 dan peringkat pertama di App Store untuk kategori Berita & Majalah. Pada tahun 2017, Weitzman masuk daftar Forbes 30 Under 30 berkat upayanya membuat internet lebih mudah diakses bagi penyandang disabilitas belajar. Cliff juga pernah tampil di EdSurge, Inc., PC Mag, Entrepreneur, Mashable, dan berbagai media terkemuka lainnya.

speechify logo

Tentang Speechify

#1 Pembaca Teks ke Ucapan

Speechify adalah platform teks ke ucapan terkemuka di dunia, dipercaya oleh lebih dari 50 juta pengguna dan didukung oleh lebih dari 500.000 ulasan bintang lima di berbagai aplikasi teks ke ucapan iOS, Android, Ekstensi Chrome, aplikasi web, dan desktop Mac. Pada tahun 2025, Apple memberikan Speechify penghargaan terhormat Apple Design Award di WWDC, menyebutnya sebagai “sumber penting yang membantu orang menjalani hidup mereka.” Speechify menawarkan 1.000+ suara alami dalam 60+ bahasa dan digunakan di hampir 200 negara. Suara selebriti termasuk Snoop Dogg dan Gwyneth Paltrow. Untuk kreator dan bisnis, Speechify Studio menyediakan alat canggih, termasuk AI Voice Generator, AI Voice Cloning, AI Dubbing, dan AI Voice Changer. Speechify juga menyokong produk-produk terkemuka dengan API teks ke ucapan berkualitas tinggi dan hemat biaya. Telah diliput di The Wall Street Journal, CNBC, Forbes, TechCrunch, dan banyak media besar lainnya, Speechify adalah penyedia teks ke ucapan terbesar di dunia. Kunjungi speechify.com/news, speechify.com/blog, dan speechify.com/press untuk informasi lebih lanjut.