1. Laman Utama
  2. API
  3. Bagaimana API Teks ke Ucapan Speechify Menyokong SSML
Diterbitkan pada API

Bagaimana API Teks ke Ucapan Speechify Menyokong SSML

Cliff Weitzman

Cliff Weitzman

CEO/Pengasas Speechify

API Speechify menawarkan kependaman 300ms, suara berkualiti seperti manusia, dan 50+ bahasa

apple logoAnugerah Reka Bentuk Apple 2025
50J+ Pengguna

Speechify Text to Speech (TTS) API berada di barisan hadapan teknologi suara boleh suai, menawarkan sokongan kukuh untuk Speech Synthesis Markup Language (SSML). Fungsi canggih ini membolehkan pembangun menghasilkan vokal yang disesuaikan terus melalui kod, memperkayakan penyampaian teks digital dengan intonasi, ritma dan emosi yang tepat. Dalam artikel ini, kami terangkan bagaimana Speechify Text to Speech API memanfaatkan SSML untuk mengubah teks biasa jadi output suara yang kaya dan ekspresif, membolehkan aplikasi di pelbagai sektor sampaikan pengalaman pengguna yang lebih semula jadi dan menarik.

Gambaran Keseluruhan API Teks ke Ucapan Speechify

Speechify Text to Speech API ialah alat mantap yang menukar teks bertulis kepada pertuturan semula jadi. Dengan menggunakan rangkaian neural lanjutan dan teknik pembelajaran mesin, API ini boleh menjana pertuturan yang kedengaran asli dan menarik. Ia menyokong pelbagai bahasa dan dialek serta menawarkan banyak pilihan suara lelaki dan wanita, sesuai untuk pelbagai jenis pengguna. Fleksibiliti ini menjadikan Speechify Text to Speech API pilihan terbaik untuk pembangun yang mahu integrasi fungsi teks ke ucapan dalam aplikasi, laman web atau servis interaktif, sekaligus memastikan pengalaman pengguna yang lancar dan inklusif.

Apa itu SSML?

Speech Synthesis Markup Language (SSML) ialah bahasa penanda berasaskan XML penting untuk pembangun mengawal bagaimana teks ke ucapan menukar teks bertulis menjadi suara. SSML membenarkan penyesuaian ciri suara seperti nada, kadar, volum dan sebutan—menyediakan kawalan supaya bunyi lebih mirip manusia dan mengikut rentak sebenar. Teknologi ini sangat berguna dalam situasi kritikal seperti kandungan pendidikan, respons interaktif, atau penceritaan di mana nada dan nuansa pertuturan sangat berkesan.

Peranan SSML dalam Mempertingkatkan Teks ke Ucapan

Integrasi SSML memperbaiki teknologi teks ke ucapan dengan membolehkan kawalan lebih terperinci ke atas pertuturan yang dihasilkan, berbanding sistem teks ke ucapan asas dahulu. Fungsi ini menyokong aliran dialog semula jadi, menyesuaikan kelajuan, kadar dan berhenti agar hasil ucapan sesuai dengan keperluan konteks, misal menambah jeda dramatik atau menukar kadar membaca mengikut keperluan pendengar. Peranan SSML dalam teknologi teks ke ucapan menandakan lonjakan besar ke arah suara komputer yang semakin hampir dengan suara manusia, menjadikan interaksi digital lebih mesra dan mudah difahami.

Bagaimana Speechify Menyokong SSML

Speechify Text to Speech API komited memberikan pengalaman audio terbaik serta menyokong SSML untuk memperkaya proses penukaran teks ke ucapan. Dengan SSML, pembangun boleh melaras hasil audio bagi memenuhi keperluan projek mereka. Sokongan ini termasuk pelarasan intonasi, tekanan dan dinamik suara—penting untuk ekspresi dan maksud. Speechify Text to Speech API dengan keupayaan SSML memastikan pengguna akhir mendapat pengalaman mendengar yang halus dan terarah serta boleh meningkatkan kualiti penggunaan aplikasi.

Kelebihan Menggunakan SSML dalam Speechify

Menggunakan SSML bersama Speechify Text to Speech API memberi pelbagai kelebihan, termasuk: 

  • Penyesuaian: SSML mengubah hasil suara agar sesuai dengan konteks aplikasi, memberikan pengalaman pengguna lebih peribadi.
  • Penglibatan Pengguna: SSML melibatkan pengguna dengan suara dinamik, jelas dan sedap didengar.
  • Penambahbaikan Kebolehcapaian: SSML melalui teks ke ucapan meningkatkan kebolehcapaian untuk semua pengguna, terutamanya OKU.
  • Keberkesanan: SSML meningkatkan komunikasi dalam aplikasi di mana mutu dan kejelasan suara amat penting.

Asas SSML dalam API Teks ke Ucapan Speechify 

Speechify Text to Speech API menggabungkan alat kukuh iaitu Speech Synthesis Markup Language untuk mempertingkat dan kawal hasil suara supaya lebih hidup. Dengan menguasai teknik SSML ini, anda boleh memperbaiki ekspresi dan keberkesanan aplikasi teks ke ucapan anda. Sama ada untuk kebolehcapaian, hiburan, atau pendidikan, SSML menyediakan alat untuk menjadikan interaksi digital lebih mesra dan menarik. Berikut asasnya:

Aksara Escape dalam SSML

Untuk pastikan kod SSML difahami dengan betul oleh parser, beberapa aksara dalam teks mesti di-'escape'. Ini elak ia disalah tafsir sebagai sintaks markup. Berikut contoh aksara khas dan padanannya:

  • Ampersand (&) jadi &
  • Tanda lebih besar (>) jadi >
  • Tanda kurang (<) jadi &lt;
  • Tanda petik dua (") jadi &quot;
  • Apostrof (') jadi &apos;

Contoh: Menukar baris dengan aksara khas:

const escapeSSMLChars = (text: string) =>

  text

    .replaceAll('&', '&amp;')

    .replaceAll('<', '&lt;')

    .replaceAll('>', '&gt;')

    .replaceAll('"', '&quot;')

    .replaceAll('\'', '&apos;')

Contohnya, mengubah teks: Some "text" with 5 < 6 & 4 > 8 in it jadi: <speak>Some &quot;text&quot; with 5 &lt; 6 &amp; 4 &gt; 8 in it</speak>

Keekspresifan Suara

SSML membolehkan ubah nada, kadar dan volum suara, memberikan pengalaman audio lebih kaya:

  1. Nada: Laras suara dari sangat rendah (x-low) ke sangat tinggi (x-high), atau tetapkan mengikut peratusan untuk penyesuaian halus.
  2. Kadar: Kawal kelajuan pertuturan dari sangat perlahan (x-slow) ke sangat laju (x-fast), atau ubah mengikut peratusan.
  3. Volum: Tetapkan kekuatan dari senyap hingga sangat kuat (x-loud), boleh diubah ikut dB atau peratusan mengikut konteks.

Contoh:

<speak>

    Ini corak pertuturan biasa.

    <prosody pitch="high" rate="fast" volume="+20%">

        Saya bercakap dengan nada lebih tinggi, lebih laju dan lebih kuat!

    </prosody>

    Kembali ke corak pertuturan biasa.

</speak>

Jeda dan Penekanan Suara

SSML mempunyai tag <break> dan <emphasis> yang penting untuk menjadikan suara lebih semula jadi dan ekspresif:

  • Break: Masukkan jeda dengan kekuatan atau tempoh tertentu untuk penekanan atau memisahkan bahagian ucapan.
  • Penekanan: Tambah atau kurangkan penekanan pada perkataan untuk sampaikan emosi atau kepentingan, sekali gus memupuk minat pendengar.

<speak>

    Kadang-kadang berguna tambahkan jeda panjang di hujung ayat.

    <break strength="medium" />

    Atau <break time="100ms" /> kadang-kadang di <break time="1s" /> tengah ayat.

</speak>

Kawalan Suara Lanjutan

Speechify juga ada tag khas <speechify:style> yang membolehkan anda laras emosi dan rentak suara, menjadikan pertuturan lebih hidup dan bermakna.

Contoh:

<speak>

    <speechify:style emotion="angry" cadence="fast">

        Berapa kali anda mahu tanya saya perkara ini?

    </speechify:style>

</speak>

Mengimplementasi SSML dengan Speechify

Pembangun boleh mengintegrasi SSML ke Speechify API menerusi langkah berikut:

  1. Tetapan Persekitaran: Sediakan persekitaran pembangunan untuk menyokong permintaan HTTP.
  2. Pengesahan API: Mohon kunci API Speechify dan letak dalam header permintaan.
  3. Rangka Kandungan SSML: Cipta skrip SSML mengikut keperluan aplikasi anda.
  4. Hantar Permintaan API: Lampirkan skrip SSML pada permintaan POST dan hantar ke endpoint API Speechify.
  5. Proses Respons: Dapatkan dan urus output audio, pastikan menepati piawaian aplikasi anda.

Kes Penggunaan SSML dalam API Teks ke Ucapan Speechify

API Teks ke Ucapan Speechify dengan SSML sangat penting untuk menyesuaikan ucapan bagi keperluan dan konteks tertentu; ia mengubah landskap komunikasi digital. Ini antara cara fleksibiliti SSML dalam API Speechify digunakan pada pelbagai aplikasi:

  1. Kebolehcapaian: SSML penting untuk bantu pengguna bermasalah penglihatan atau membaca.
  2. Platform E-Pembelajaran: SSML memperkayakan kandungan pendidikan dengan variasi nada & penekanan, mengekalkan minat pelajar.
  3. Pembantu Maya: SSML menjadikan interaksi maya lebih manusiawi dan mesra pengguna.
  4. Audiobook: SSML menggunakan pelbagai suara dan ekspresi untuk menghidupkan cerita.
  5. Bot Khidmat Pelanggan: SSML menghasilkan respons mesra, jelas dan mengurangkan salah faham.
  6. Alat Pembelajaran Bahasa: SSML membantu dalam pendidikan bahasa dengan menekankan sebutan dan kefahaman mendengar.
  7. Pengumuman Awam: SSML pastikan maklumat jelas & berkesan di persekitaran bising/awam.
  8. Permainan Video: SSML menambah karakter dengan dialog dinamik.
  9. Penghasilan Podcast: SSML memudahkan penghasilan kandungan audio pelbagai untuk pendengar.
  10. Komunikasi Penjagaan Kesihatan: SSML berkomunikasi dengan pesakit melalui tona suara tenang dan meyakinkan.
  11. Sistem Navigasi: SSML menambah kejelasan dan penekanan pada arahan penting.
  12. Sistem Telefon: SSML memperbaiki sistem IVR dengan suara lebih semula jadi.
  13. Pembentangan Multimedia: SSML meningkatkan kualiti suara narasi profesional.
  14. Peranti Rumah Pintar: SSML integrasi respons suara lebih pintar dan intuitif.

Amalan Terbaik SSML untuk Pembangun 

Sama ada anda cipta IVR, audiobook atau pembantu maya, memahami penggunaan SSML boleh meningkatkan kualiti dan hasil projek sintesis percakapan anda. Berikut amalan terbaik untuk pembangun:

  • Uji pelbagai tag SSML untuk dapatkan tetapan terbaik bagi kes anda.
  • Sentiasa kemas kini dan perbaik skrip SSML mengikut maklum balas pengguna.
  • Pastikan tag SSML disusun rapi dan ikut piawaian XML untuk elak ralat pemprosesan.

Kesimpulan

Dengan menyokong kemampuan halus SSML, Speechify membolehkan pembangun cipta pengalaman pertuturan lebih kaya dan seakan manusia bagi pelbagai aplikasi. Sama ada kawal nada, kadar, volum, atau tag lanjutan untuk ekspresi dan irama, API ini pastikan setiap perkataan bukan hanya didengar, tetapi dirasai. Integrasi SSML dengan teknologi kukuh TTS Speechify bukan sahaja memperluas aplikasi suara malah meningkatkan penglibatan dan kebolehcapaian kandungan digital, memudahkan inovasi dalam interaksi suara digital.

FAQ

Adakah API Teks ke Ucapan Speechify menyokong SSML?

Ya, Speechify Text to Speech API menyokong penuh Speech Synthesis Markup Language (SSML) untuk memperkaya ekspresi dan penyesuaian hasil suara.

Apa maksud SSML?

SSML bermaksud Speech Synthesis Markup Language, iaitu bahasa penanda piawai untuk kawal ciri ucapan sintetik seperti nada, kelajuan & tona suara.

Bagaimana SSML beri manfaat pada teks ke ucapan?

SSML memanfaatkan teks ke ucapan dengan kawalan khusus pada hasil ucapan supaya bunyinya lebih semula jadi dan mengikut keperluan pengguna.

Apa kepentingan SSML?

Kepentingan SSML ialah ia beri kawalan terperinci pada suara sintetik, sekaligus meningkatkan kejelasan dan daya tarikan ucapan untuk pelbagai aplikasi.

Di mana saya boleh tahu lebih lanjut tentang SSML untuk API Teks ke Ucapan Speechify?

Anda boleh pelajari lebih lanjut tentang keupayaan Speechify Text to Speech API dan SSML serta cara implementasinya di laman dokumentasi rasmi Speechify.

Akses suara-suara kegemaran Speechify melalui API yang pantas, boleh diskalakan, dan mesra pembangun

Dapatkan Akses API
api access banner

Kongsi Artikel Ini

Cliff Weitzman

Cliff Weitzman

CEO/Pengasas Speechify

Cliff Weitzman ialah pejuang hak disleksia serta CEO dan pengasas Speechify, aplikasi teks ke ucapan #1 di dunia dengan lebih 100,000 ulasan 5 bintang dan menduduki tempat pertama di App Store dalam kategori Berita & Majalah. Pada tahun 2017, Weitzman tersenarai dalam Forbes 30 Under 30 atas usahanya menjadikan internet lebih mesra untuk individu dengan keperluan pembelajaran. Cliff Weitzman pernah dipaparkan di EdSurge, Inc., PC Mag, Entrepreneur, Mashable dan pelbagai saluran media utama yang lain.

speechify logo

Tentang Speechify

Pembaca Teks ke Ucapan #1

Speechify ialah platform teks ke ucapan terkemuka dunia, dipercayai oleh lebih 50 juta pengguna dan disokong oleh lebih daripada 500,000 ulasan lima bintang merentasi aplikasi teks ke ucapannya iOS, Android, Pemalam Chrome, aplikasi web, dan aplikasi desktop Mac. Pada tahun 2025, Apple telah menganugerahkan Speechify dengan Anugerah Reka Bentuk Apple yang berprestij di WWDC, menyifatkannya sebagai “sumber penting yang membantu orang menjalani hidup mereka.” Speechify menawarkan lebih 1,000 suara semula jadi dalam lebih 60 bahasa dan digunakan di hampir 200 negara. Suara selebriti termasuk Snoop Dogg dan Gwyneth Paltrow. Untuk pencipta dan perniagaan, Speechify Studio menyediakan alat canggih termasuk Penjana Suara AI, Penduaan Suara AI, Alih Suara AI, dan Penukar Suara AI. Speechify juga memacu produk terkemuka dengan API teks ke ucapan berkualiti tinggi dan kos efektif. Pernah dipaparkan dalam The Wall Street Journal, CNBC, Forbes, TechCrunch, dan media utama lain, Speechify ialah penyedia teks ke ucapan terbesar di dunia. Lawati speechify.com/news, speechify.com/blog, dan speechify.com/press untuk maklumat lanjut.