1. Pagrindinis
  2. API
  3. Kaip „Speechify“ teksto į kalbą API palaiko SSML
Paskelbta API

Kaip „Speechify“ teksto į kalbą API palaiko SSML

Cliff Weitzman

Cliff Weitzman

„Speechify“ generalinis direktorius / įkūrėjas

Speechify API užtikrina 300 ms delsą, žmogaus kokybės balsus ir daugiau nei 50 kalbų

apple logo2025 m. Apple dizaino apdovanojimas
50 mln.+ vartotojų

Speechify teksto į kalbą (TTS) API yra pažangi, pritaikoma kalbos technologija, siūlanti stiprų Speech Synthesis Markup Language (SSML) palaikymą. Ši išplėstinė funkcija leidžia kūrėjams programiškai kurti tikslias, išraiškingas kalbines interpretacijas su intonacija, ritmu ir emocijomis. Šiame straipsnyje aptariame, kaip Speechify teksto į kalbą API išnaudoja SSML, kad paverstų tekstą turtingu, išraiškingu garsu ir suteiktų natūralią, įtraukiančią patirtį įvairiose srityse.

„Speechify“ teksto į kalbą API apžvalga

Speechify teksto į kalbą API – tai įrankis, kuris paverčia rašytinį tekstą gyvu, natūraliu balsu. Naudojant pažangius neuroninius tinklus ir mašininio mokymosi metodus, API generuoja kalbą, kuri skamba natūraliai ir įtraukiai. Ji palaiko daugybę kalbų ir tarmių bei siūlo įvairius balsus – nuo vyriškų iki moteriškų, todėl tinka įvairiems vartotojams. Lankstumas leidžia kūrėjams integruoti teksto į kalbą funkciją į programas, svetaines ar interaktyvias paslaugas ir suteikti sklandžią, prieinamą naudotojo patirtį.

Kas yra SSML?

Speech Synthesis Markup Language (SSML) – tai XML pagrindu sukurta žymėjimo kalbos standartas, kuriuo kūrėjai nurodo, kaip teksto į kalbą sistemos paverčia tekstą garsu. SSML leidžia tiksliai valdyti kalbos aspektus, tokius kaip tonas, greitis, garsumas ir tarimas – taip garsas tampa artimesnis žmogaus balsui ir ritmui. Tai itin svarbu ten, kur būtina perteikti kalbos niuansus: švietime, dialoguose ar pasakojimuose.

SSML vaidmuo tobulinant teksto į kalbą

Integruotas SSML išplečia teksto į kalbą technologiją, suteikdamas galimybę valdyti kalbos niuansus, ko nebuvo įmanoma su bazinėmis sistemomis. Tai leidžia natūralesnius dialogus, sklandesnį kalbos srautą ir pritaikytą garsą pagal kontekstą – pvz., įterpti pauzes ar reguliuoti greitį pagal vartotoją. SSML naudojimas teksto į kalbą sistemoje priartina skaitmeninį garsą prie žmogaus kalbos ir sukuria labiau suprantamą, įsimintiną patirtį.

Kaip „Speechify“ palaiko SSML

Speechify teksto į kalbą API siekia aukščiausios garso kokybės ir palaiko SSML, kad praturtintų teksto į kalbą konvertavimą. Naudodami SSML, kūrėjai gali tiksliai pritaikyti garsą konkrečiam projektui. Čia galima valdyti kalbos dinamiką, intonaciją ir akcentus – tai ypač svarbu perduodant emocijas ir prasmę. Speechify teksto į kalbą API SSML funkcijos užtikrina, kad galutinis vartotojas gautų kokybišką, aiškią ir pritaikytą klausymo patirtį, didinančią patogumą ir naudojimo malonumą.

SSML naudojimo „Speechify” privalumai

Naudojant SSML su Speechify teksto į kalbą API gaunama daug privalumų, pvz.:

  • Pritaikymas: SSML leidžia tiksliai pritaikyti rezultatą pagal kontekstą ar paskirtį, todėl patirtis tampa asmeniškesnė.
  • Didesnis įtraukimas: SSML užtikrina dinamišką ir malonų klausymą aiškiu, suprantamu balsu.
  • Prieinamumo gerinimas: SSML su teksto į kalbą padaro technologiją prieinamesnę, ypač žmonėms su negalia.
  • Didesnis efektyvumas: SSML pagerina balso kokybę ir suprantamumą, kas labai svarbu sėkmingai komunikacijai.

Pagrindai: SSML „Speechify“ API 

Speechify teksto į kalbą API naudoja galingą Speech Synthesis Markup Language įrankį kalbos valdymui, todėl įgarsinimas tampa gyvesnis ir natūralesnis. Įvaldę šiuos SSML metodus, žymiai pagerinsite savo teksto į kalbą programėles. Nesvarbu, ar tai prieinamumui, pramogoms ar švietimui, SSML leidžia kalbai skambėti žmogiškiau ir artimiau. Pagrindiniai dalykai:

SSML: specialūs simboliai

Kad SSML kodas būtų teisingai suprantamas, kai kuriuos simbolius tekste būtina „pabėgti“, kad jie nebūtų painiojami su žymėjimu. Dažniausi simbolių pavertimai:

  • Ampersandas (&) → &
  • Didesnis nei (>) → >
  • Mažesnis nei (<) → &lt;
  • Kabutės (") → &quot;
  • Apostrofas (') → &apos;

Pavyzdys: kaip pakeisti eilutę su specialiais simboliais:

const escapeSSMLChars = (text: string) =>

  text

    .replaceAll('&', '&amp;')

    .replaceAll('<', '&lt;')

    .replaceAll('>', '&gt;')

    .replaceAll('"', '&quot;')

    .replaceAll('\'', '&apos;')

Pvz., tekstas: Some "text" with 5 < 6 & 4 > 8 in it, pavertus: <speak>Some &quot;text&quot; with 5 &lt; 6 &amp; 4 &gt; 8 in it</speak>

Kalbos išraiškingumas

SSML leidžia keisti kalbos toną, tempą ir garsumą – todėl ji skamba patraukliau ir tikroviškiau:

  1. Tonas: reguliuokite nuo labai žemo (x-low) iki ypač aukšto (x-high) arba procentais.
  2. Tempas: valdykite sakinio greitį nuo labai lėto (x-slow) iki labai greito (x-fast) arba procentais.
  3. Garsumas: nustatykite tylų, garsų (x-loud), reguliuokite decibelais ar procentais pagal poreikį.

Pavyzdys:

<speak>

    Tai įprastas kalbėjimo stilius.

    <prosody pitch="high" rate="fast" volume="+20%">

        Aš kalbu aukštesniu tonu, greičiau ir garsiau!

    </prosody>

    Grįžtame prie įprasto kalbėjimo.

</speak>

Pauzės ir akcentai kalboje

SSML žymės „<break>“ ir „<emphasis>“ daro kalbą natūralesnę ir išraiškingesnę:

  • Break: įterpia pauzes pagal pasirinktą stiprumą ar trukmę, pabrėžiant mintis ar skiriant dalis kalboje.
  • Emphasis: sustiprina ar susilpnina žodžių akcentą, kad išreikštų emociją ir svarbą, didinant įsitraukimą.

<speak>

    Kartais naudinga sakinio pabaigoje įterpti ilgą pauzę.

    <break strength="medium" />

    Arba <break time="100ms" /> kartais per <break time="1s" /> vidurį.

</speak>

Išplėstinis kalbos valdymas

Speechify taip pat turi savo žymę „<speechify:style>“, leidžiančią valdyti balso emociją ir tempą – taip garsas tampa artimesnis žmogui ir paveikesnis.

Pavyzdys:

<speak>

    <speechify:style emotion="angry" cadence="fast">

        Kiek kartų dar to klausi?

    </speechify:style>

</speak>

Kaip įgyvendinti SSML su Speechify

Kūrėjai gali įtraukti SSML į Speechify API atlikdami šiuos veiksmus:

  1. Aplinkos paruošimas: nustatykite programavimo aplinką HTTP užklausoms.
  2. API autentifikavimas: gaukite Speechify API raktą ir pridėkite prie užklausos antraštės.
  3. Kurti SSML turinį: parašykite SSML scenarijų pagal programos poreikius.
  4. Siųsti API užklausą: įtraukite SSML scenarijų į POST užklausą ir siųskite Speechify API adresu.
  5. Apdoroti atsakymą: gaukite ir pritaikykite garso išvestį, kad atitiktų jūsų programos reikalavimus.

SSML pritaikymo atvejai su Speechify API

Speechify teksto į kalbą API SSML galimybės padeda pritaikyti kalbėjimą pagal poreikį ir keičia skaitmeninį garso pasaulį. Štai kaip SSML universalumas atsiskleidžia su Speechify API skirtingose srityse:

  1. Prieinamumas: SSML svarbus kuriant prieinamas technologijas regos ar skaitymo sunkumų turintiems žmonėms.
  2. E-mokymosi platformos: SSML suteikia įvairių tonų ir akcentų, palaikančių mokinių susidomėjimą.
  3. Virtualūs asistentai: SSML priartina dirbtinį bendravimą prie žmogui pažįstamo bendravimo.
  4. Audioknygos: SSML leidžia naudoti skirtingus balsus ir emocijas pasakojime.
  5. Klientų aptarnavimo botai: SSML leidžia pateikti aiškesnius ir malonesnius atsakymus, mažinant nesusipratimus.
  6. Kalbų mokymosi įrankiai: SSML padeda išmokti tartį ir lavinti klausymą.
  7. Viešieji pranešimai: SSML užtikrina aiškumą ir girdimumą viešose ar triukšmingose vietose.
  8. Vaizdo žaidimai: SSML suteikia dinamiškus dialogus ir išraiškingus veikėjų balsus.
  9. Podcastų kūrimas: SSML padeda kurti įvairesnį ir patrauklesnį garsinį turinį.
  10. Sveikatos apsaugos komunikacija: SSML ramina pacientus ramiu ir užtikrintu tonu.
  11. Navigacijos sistemos: SSML didina svarbių nurodymų aiškumą ir akcentą.
  12. Telefonijos sistemos: SSML pagerina IVR sistemų garsą, kad balsas skambėtų natūraliai.
  13. Multimedijos prezentacijos: SSML suteikia profesionalų naratyvą prezentacijose.
  14. Išmanieji namų įrenginiai: SSML suteikia intuityvesnius ir jautresnius balso atsakymus.

Geriausia SSML praktika kūrėjams 

Nesvarbu, ar kuriate IVR balsus, audioknygas ar virtualius asistentus – suprasdami, kaip veiksmingai naudoti SSML, ženkliai pagerinsite savo balso sintezės projektus. Štai keletas geriausių patarimų kūrėjams:

  • Eksperimentuokite su įvairiomis SSML žymėmis ir ieškokite geriausių nustatymų savo atvejui.
  • Nuolat atnaujinkite ir tobulinkite SSML kodą, atsižvelgdami į vartotojų atsiliepimus.
  • Įsitikinkite, kad SSML žymės teisingai įdėtos ir atitinka XML standartą – išvengsite klaidų.

Išvada

Palaikydama išplėstines SSML galimybes, Speechify leidžia kurti įtaigesnę ir natūraliau skambančią kalbą įvairioms sritims. Čia galite tiksliai valdyti toną, tempą, garsumą ar pritaikyti emocijas bei ritmiką – API užtikrina, jog kiekvienas žodis būtų ne tik išgirstas, bet ir „pajustas“. SSML integracija su TTS technologija ne tik išplečia balso programų ribas, bet ir padidina prieinamumą bei įtrauktį, todėl ši API – būtinas inovacijų įrankis kasdienėje skaitmeninėje komunikacijoje.

DUK

Ar Speechify teksto į kalbą API palaiko SSML?

Taip, Speechify teksto į kalbą API visiškai palaiko Speech Synthesis Markup Language (SSML), todėl galite personalizuoti ir išplėsti kalbos išraišką.

Ką reiškia SSML?

SSML reiškia Speech Synthesis Markup Language – tai standartizuota žymėjimo kalba, leidžianti valdyti kalbos sintezės parametrus, tokius kaip tonas, greitis ar tembras.

Kaip SSML naudingas teksto į kalbą sistemoms?

SSML suteikia galimybę tiksliai valdyti kalbos srautą teksto į kalbą sistemose – garsas tampa natūralesnis ir lengvai pritaikomas vartotojams ar situacijai.

Kodėl svarbus SSML?

SSML svarbus dėl to, kad leidžia niuansuotai valdyti kalbos generavimą, pagerinti tekstinės informacijos aiškumą ir įtraukimą skirtinguose pritaikymuose.

Kur galima sužinoti daugiau apie Speechify API SSML?

Sužinokite daugiau apie Speechify teksto į kalbą API SSML galimybes ir jų diegimą oficialioje Speechify API dokumentacijoje jų svetainėje.

Pasiekite mėgstamus Speechify balsus per API – greita, lengvai plečiama ir draugiška kūrėjams

Gauti API prieigą
api access banner

Pasidalykite šiuo straipsniu

Cliff Weitzman

Cliff Weitzman

„Speechify“ generalinis direktorius / įkūrėjas

Cliff Weitzman – disleksijos šalininkas, „Speechify“ vadovas ir įkūrėjas. „Speechify“ – pirmaujanti pasaulyje teksto į kalbą programa, turinti daugiau nei 100 000 penkių žvaigždučių įvertinimų ir lyderiaujanti „App Store“ naujienų ir žurnalų kategorijoje. 2017 m. „Forbes“ jį įtraukė į „30 iki 30“ sąrašą už indėlį didinant interneto prieinamumą žmonėms su mokymosi sutrikimais. Apie jį rašė „EdSurge“, „Inc.“, „PC Mag“, „Entrepreneur“, „Mashable“ ir kt.

speechify logo

Apie Speechify

#1 teksto į kalbą skaitytuvas

Speechify yra pirmaujanti pasaulyje teksto į kalbą platforma, kuria pasitiki daugiau nei 50 milijonų vartotojų ir kurią pagrindžia daugiau nei 500 000 penkių žvaigždučių atsiliepimų skirtingose teksto į kalbą iOS, Android, Chrome plėtinio, internetinės programėlės ir Mac darbalaukio programose. 2025 m. Apple apdovanojo Speechify prestižiniu Apple dizaino apdovanojimu per WWDC, pavadindama jį „esminiu ištekliumi, padedančiu žmonėms gyventi visavertį gyvenimą“. Speechify siūlo daugiau nei 1 000 natūraliai skambančių balsų daugiau nei 60 kalbų ir naudojamas beveik 200 šalių. Tarp įžymybių balsų – Snoop Dogg ir Gwyneth Paltrow. Kūrėjams ir verslui Speechify Studio suteikia išplėstinius įrankius, tarp kurių yra AI balso generatorius, AI balso klonavimas, AI dubliavimas ir AI balso keitiklis. Speechify taip pat aprūpina pažangius produktus kokybišku ir ekonomišku teksto į kalbą API. Apie mus rašė The Wall Street Journal, CNBC, Forbes, TechCrunch ir kiti didieji naujienų portalai, todėl Speechify yra didžiausias teksto į kalbą teikėjas pasaulyje. Apsilankykite speechify.com/news, speechify.com/blog ir speechify.com/press ir sužinokite daugiau.