Social Proof

Speechify 文字轉語音 API 如何支援 SSML

我們很高興地宣布開發一個文字轉語音的API,將Speechify最自然且受歡迎的AI語音直接提供給全球的開發者。

尋找我們的 文字轉語音閱讀器

媒體報導

forbes logocbs logotime magazine logonew york times logowall street logo
使用Speechify收聽這篇文章!
Speechify

透過 SSML 支援,充分發揮 Speechify 文字轉語音 API 的潛力。

Speechify 文字轉語音 (TTS) API 站在可自訂語音技術的最前沿,提供強大的 語音合成標記語言 (SSML) 支援。這項先進功能讓開發者能夠直接透過程式碼創造精緻的語音表現,提升數位文本的語調、節奏和情感深度。在本文中,我們將探討 Speechify 文字轉語音 API 如何利用 SSML 將普通文本轉化為豐富且具表現力的語音輸出,使各行各業的應用程式能夠提供更自然和吸引人的用戶體驗。

Speechify 文字轉語音 API 概述

Speechify 文字轉語音 API 是一個強大的工具,能將書面文本轉化為逼真的語音。利用先進的神經網絡和機器學習技術,這個 API 能生成聽起來自然且引人入勝的語音。它支持多種語言和方言,提供從男性到女性聲音的多樣選擇,確保能吸引不同的用戶群體。這種靈活性使得 Speechify 文字轉語音 API 成為開發者將文字轉語音功能整合到應用程式、網站或任何互動服務中的絕佳選擇,確保流暢且包容的用戶體驗。

什麼是 SSML?

語音合成標記語言 (SSML) 是一種基於 XML 的標記語言,開發者用來指導文字轉語音系統如何將書面文本轉化為語音。 SSML 允許指定語音的各種層面,如音調、速度、音量和發音,從而實現更受控且精確的輸出,能模仿人類的語調和節奏。這項技術在語音的語氣和細微差別對溝通效果至關重要的情境中特別有用,例如教育內容、互動回應或故事講述。

SSML 在提升文字轉語音中的角色

整合 SSML 提升了文字轉語音技術,提供了操控生成語音的工具,以達到以前基本文字轉語音系統無法實現的細微效果。這種提升支持更自然的對話流程,並能根據特定情境需求調整語音輸出,例如為了戲劇效果添加停頓或調整語速以配合聽眾的處理速度。 SSML文字轉語音技術中的角色標誌著在縮小人類與電腦生成語音之間差距方面的一大進步,使數位互動更具親和力且更易於理解。

Speechify 如何支援 SSML

Speechify 文字轉語音 API 致力於提供卓越的聽覺體驗,並支持 SSML 來豐富 文字轉語音 的轉換過程。通過採用 SSML,Speechify 允許開發者微調音頻輸出,以更好地滿足不同項目的特定需求。這種支持包括調整語音的動態,如語調和重音,這對於傳達更多情感和意圖至關重要。 Speechify 文字轉語音 APISSML 功能確保最終用戶獲得精緻且目標明確的聆聽體驗,顯著提升應用程序的可用性和享受度。

使用 SSML 在 Speechify 中的好處

使用 SSML Speechify 文字轉語音 API 提供了許多優勢,包括: 

  • 自訂化: SSML 廣泛調整語音輸出以適應應用程序的上下文或目的,提供更個性化的用戶體驗。
  • 增強用戶互動: SSML 透過清晰、易懂且悅耳的動態語音互動吸引用戶。
  • 無障礙 改進: SSML文字轉語音 使技術更具可及性,提升所有用戶的整體可用性,尤其是對於有障礙的用戶。
  • 提高效率: SSML 提升應用程序中語音質量和清晰度至關重要的溝通效果。

Speechify 文字轉語音 API 的 SSML 基礎 

Speechify 文字轉語音 API 結合了強大的 語音合成標記語言 工具來增強和控制語音輸出,使數位互動聽起來更逼真和吸引人。通過掌握這些 SSML 技巧,您可以顯著提升 文字轉語音 應用程序的表達力和效果。無論是用於 無障礙、娛樂或教育,SSML 提供了使數位互動聽起來更人性化和吸引人的工具。以下是基礎知識:

SSML 中的轉義字符

為了確保 SSML 代碼被解析器正確解釋,文本中的特定字符必須被轉義。這可以防止它們被誤認為標記語法。以下是常見字符及其轉義等價物:

  • 和號 (&) 變成 &
  • 大於號 (>) 變成 >
  • 小於號 (<) 變成 &lt;
  • 雙引號 (") 變成 &quot;
  • 單引號 (') 變成 &apos;

範例:轉換包含特殊字符的行:

const escapeSSMLChars = (text: string) =>

  text

    .replaceAll('&', '&amp;')

    .replaceAll('<', '&lt;')

    .replaceAll('>', '&gt;')

    .replaceAll('"', '&quot;')

    .replaceAll('\'', '&apos;')

例如,將文字轉換:Some "text" with 5 < 6 & 4 > 8 in it 轉換為:<speak>Some &quot;text&quot; with 5 &lt; 6 &amp; 4 &gt; 8 in it</speak>

語音表達力

SSML 允許調整語音的音調、速度和音量,提供豐富的聽覺體驗:

  1. 音調:從超低(x-low)到超高(x-high)調整音調,或設置特定百分比以微調音調。
  2. 速度:控制語音的快慢,從超慢(x-slow)到超快(x-fast),或通過特定百分比精確調整速度。
  3. 音量:設置音量從靜音到超大聲(x-loud),或通過分貝或百分比調整以適應語音的上下文。

範例:

<speak>

    這是正常的語音模式。

    <prosody pitch="high" rate="fast" volume="+20%">

        我正在以更高的音調、更快的速度和更大的音量說話!

    </prosody>

    回到正常的語音模式。

</speak>

語音停頓與強調

SSML 標籤如 <break> 和 <emphasis> 對於使語音聽起來更自然和富有表現力至關重要:

  • 停頓:插入指定強度或持續時間的停頓,以強調重點或分隔語音中的部分。
  • 強調:增加或減少單詞的強調,以傳達情感或重要性,增強聽眾的參與感。

<speak>

    有時在句子結尾添加較長的停頓會很有用。

    <break strength="medium" />

    或者 <break time="100ms" /> 有時在 <break time="1s" /> 中間。

</speak>

高級語音控制

Speechify 還有一個專有標籤 <speechify:style>,可以調整語音的情感和節奏,使語音更具親和力和影響力。

範例:

<speak>

    <speechify:style emotion="angry" cadence="fast">

        你要問我多少次?

    </speechify:style>

</speak>

使用 Speechify 實現 SSML

開發人員可以通過以下步驟將 SSML 與 Speechify 的 API 集成:

  1. 環境設置:配置您的開發環境以支持HTTP請求。
  2. API身份驗證:從Speechify獲取API密鑰並將其包含在請求標頭中。
  3. 設計SSML內容:根據應用程序的特定語音需求設計您的SSML腳本。
  4. 發送API請求:將SSML腳本嵌入POST請求中並發送到Speechify API端點。
  5. 處理響應:檢索並處理音頻輸出,確保其符合應用程序的標準。

Speechify文字轉語音API的SSML使用案例

Speechify文字轉語音API的SSML功能在定制語音以滿足特定需求和情境方面至關重要,改變了數字通信的聽覺體驗。事實上,以下是Speechify API中SSML的多樣性如何在各種應用中展示:

  1. 無障礙設計: SSML 對於創建幫助視障或閱讀困難用戶的無障礙技術至關重要。
  2. 電子學習平台: SSML 通過使用不同的語調和重點來增強教育內容,保持學生的參與度。
  3. 虛擬助手: SSML 使虛擬互動更接近人類交流,提升用戶滿意度。
  4. 有聲書: SSML 使用不同的聲音和情感語調來使故事栩栩如生。
  5. 客戶服務機器人: SSML 使用量身定制的回應來提供更清晰和愉快的客戶互動,減少誤解並提高服務質量。
  6. 語言學習工具: SSML 幫助語言教育,強調發音並輔助聽力理解。
  7. 公共公告: SSML 確保在嘈雜或公共環境中清晰有效地傳達信息。
  8. 電子遊戲: SSML 通過動態對話功能增加角色深度。
  9. 播客製作: SSML 促進創作多樣且吸引人的音頻內容。
  10. 醫療溝通: SSML 使用平靜和安撫的語調與患者溝通。
  11. 導航系統: SSML 增強關鍵方向的清晰度和重點。
  12. 電話系統: SSML 改善互動語音應答(IVR)系統,提供自然的語音選項。
  13. 多媒體演示: SSML 提升演示質量,提供專業的旁白。
  14. 智能家居設備: SSML 整合更具回應性和直觀的語音互動。

開發者的最佳 SSML 實踐 

無論您是在製作互動語音應答、有聲書,還是虛擬助手,了解如何有效使用SSML 可以顯著提升語音合成項目的質量和效果。以下是一些開發者的最佳實踐:

  • 嘗試不同的SSML標籤,以發現最適合您使用情境的最佳設置。
  • 根據用戶反饋定期更新和完善SSML腳本,以提高語音輸出的質量和效果。
  • 確保SSML標籤正確嵌套並符合XML標準,以避免處理錯誤。

結論

通過支持SSML的細緻功能,Speechify允許開發者在各種應用中創造更豐富、更具人性化的語音體驗。無論是通過精確控制音調、速度和音量,還是實施情感和節奏調整的高級標籤,API確保每個說出的字不僅被聽到,還能被感受到。這種將SSML與Speechify強大的TTS技術相結合,不僅擴大了語音應用的範圍,還加深了數位內容的可及性,使其成為開發者在語音數位互動領域創新不可或缺的工具。

常見問題

Speechify文字轉語音API是否支持SSML?

是的,Speechify文字轉語音API完全支持語音合成標記語言SSML),以增強語音輸出的表達性和自定義性。

SSML代表什麼? 

SSML代表語音合成標記語言,這是一種標準化的標記語言,允許開發者控制合成語音的音調、速度和語氣等方面。

SSML如何提升文字轉語音的效果? 

SSML通過提供對語音輸出的精確控制,使其聽起來更自然,並能根據特定情境和用戶需求進行調整,從而提升文字轉語音的效果。

SSML的重要性是什麼? 

SSML的重要性在於其能夠提供對合成語音的細緻控制,從而提高語音文本在各種應用中的清晰度和吸引力。

我可以在哪裡了解更多關於Speechify文字轉語音API的SSML?

您可以通過訪問Speechify的官方API文檔和網站上的資源,了解更多關於Speechify文字轉語音APISSML功能及其實施方法。

Cliff Weitzman

Cliff Weitzman

Cliff Weitzman 是一位閱讀障礙倡導者,也是全球排名第一的文字轉語音應用程式 Speechify 的創辦人兼執行長,該應用程式擁有超過 100,000 則五星評價,並在 App Store 的新聞與雜誌類別中名列第一。2017 年,Weitzman 因其在提升學習障礙者網路可及性方面的貢獻,被列入福布斯 30 歲以下 30 人榜單。Cliff Weitzman 曾被 EdSurge、Inc.、PC Mag、Entrepreneur、Mashable 等知名媒體報導。