Com Speechify Text to Speech API admet SSML

Speechify Text to Speech (TTS) API lidera la tecnologia de veu personalitzable i ofereix un ampli suport per a Speech Synthesis Markup Language (SSML). Aquesta funcionalitat avançada permet als desenvolupadors crear veus d'alta qualitat directament des del codi, millorant la lectura digital amb una entonació, ritme i profunditat emocional precisos. En aquest article s'explica com Speechify Text to Speech API aprofita SSML per transformar text pla en veu expressiva, perquè aplicacions de tot tipus puguin oferir experiències més naturals i atractives.

Visió general de l’API de Text a Veu de Speechify

Speechify Text to Speech API és una eina potent que converteix text escrit en veu natural. Amb xarxes neuronals avançades i aprenentatge automàtic, pot generar veus que sonen reals i interessants. Dona suport a molts idiomes i dialectes, amb múltiples opcions masculines i femenines per adaptar-se a qualsevol perfil d'usuari. Aquesta flexibilitat fa de Speechify Text to Speech API l’opció ideal per a desenvolupadors que volen integrar veu a apps, webs o serveis interactius, garantint una experiència inclusiva i fluida.

Què és SSML?

Speech Synthesis Markup Language (SSML) és un llenguatge de marques basat en XML que permet als desenvolupadors definir com els sistemes de text a veu converteixen el text escrit en veu. SSML permet controlar l’entonació, el ritme, el volum i la pronunciació, per aconseguir una sortida més precisa i humana. Aquesta tecnologia és especialment útil quan el to i la subtilesa són essencials, com en continguts educatius, respostes interactives o narracions d’històries.

El paper del SSML per a la veu sintètica

La integració de SSML millora la tecnologia de text a veu permetent manipular la veu generada de forma específica i avançada, superant els sistemes bàsics de veu sintètica. Amb SSML s’obtenen diàlegs més naturals i adaptats a cada context, afegint pauses dramàtiques o variant la velocitat segons les necessitats. El SSML en text a veu marca un salt important per apropar la parla digital a la comunicació humana, fent-la més natural i comprensible.

Com Speechify suporta SSML

Speechify Text to Speech API ofereix una experiència auditiva superior i admet SSML per enriquir la conversió de text a veu. Amb SSML els desenvolupadors poden afinar la sortida d’àudio perquè s’adapti a cada projecte. Això inclou ajustar l’entonació i l’èmfasi, clau per transmetre emoció i intenció. Speechify Text to Speech API i el seu SSML asseguren una experiència final refinada i personalitzada, millorant notablement l’ús i el gaudi de l’aplicació.

Avantatges d’usar SSML a Speechify

Fer servir SSML amb Speechify Text to Speech API aporta molts beneficis, com per exemple:

Personalització: SSML adapta la veu digital a cada context o propòsit, oferint una experiència molt més personalitzada.
Més compromís: SSML capta l’atenció de l’usuari amb veus dinàmiques, clares i agradables.
Millores d’accessibilitat: SSML amb text a veu fa la tecnologia més accessible, especialment per a persones amb discapacitat.
Més eficàcia: SSML millora la qualitat de la comunicació en aplicacions on la veu és clau.

Bàsics de l’SSML de Speechify Text to Speech API

Speechify Text to Speech API incorpora la potència de Speech Synthesis Markup Language per millorar i controlar la sortida de veu, aconseguint una interacció digital més natural i atractiva. Dominant aquestes tècniques de SSML pots fer molt més expressives i efectives les teves aplicacions de text a veu. Ja sigui per a accessibilitat, entreteniment o educació, SSML ofereix eines per fer la veu digital més humana i atractiva. Aquests són els bàsics:

Caràcters escapats en SSML

Perquè el codi SSML sigui interpretat correctament, alguns caràcters especials s’han d’escapar. Això evita ambigüitats amb la sintaxi de marques. A continuació tens els més comuns i el seu equivalent escapçat:

Ampersand (&) esdevé &
Signe major (>) esdevé >
Signe menor (<) esdevé <
Cometes (") esdevé "
Apòstrof (') esdevé '

Exemple: Convertir una línia amb caràcters especials:

const escapeSSMLChars = (text: string) =>

text

.replaceAll('&', '&')

.replaceAll('<', '<')

.replaceAll('>', '>')

.replaceAll('"', '"')

.replaceAll('\'', ''')

Per exemple, convertir el text: Some "text" with 5 < 6 & 4 > 8 in it, produeix: <speak>Some "text" with 5 < 6 & 4 > 8 in it</speak>

Expressivitat a la veu

SSML permet manipular el to, la velocitat i el volum de la veu per aconseguir una experiència auditiva més rica:

To: Ajusta’l des d’extra baix (x-low) fins a extra alt (x-high) o estableix un percentatge per matisar encara més.
Velocitat: Controla la rapidesa, de molt lent (x-slow) a molt ràpid (x-fast), o afina-ho per percentatge.
Volum: Pot anar de silenci fins a extra fort (x-loud), o ajustar-ho en decibels o percentatge.

Exemple:

<speak>

Aquest és un patró de veu normal.

Parlo amb to alt, més ràpid i més fort!

</prosody>

Tornem al patró de veu normal.

</speak>

Pauses i èmfasi en la veu

SSML inclou etiquetes com <break> i <emphasis> per humanitzar i expressar millor la veu generada:

Break: Afegeix pauses, amb intensitat o durada, per recalcar punts o separar seccions.
Emphasis: Augmenta o redueix l’èmfasi d’algunes paraules per transmetre emoció o importància, potenciant l’atenció de qui escolta.

<speak>

A vegades és útil posar una pausa més llarga al final de la frase.

O <break time="100ms" /> i a vegades <break time="1s" /> al mig.

</speak>

Control avançat de la veu

Speechify també té l’etiqueta exclusiva <speechify:style>, que permet ajustar l’emoció i la cadència de la veu per fer-la més propera i impactant.

Exemple:

<speak>

<speechify:style emotion="angry" cadence="fast">

Quantes vegades em pots preguntar això?

</speechify:style>

</speak>

Com implementar SSML amb Speechify

Els desenvolupadors poden integrar SSML a l’API de Speechify seguint aquests passos:

Prepara l’entorn: Configura el teu entorn per suportar peticions HTTP.
Autenticació: Sol·licita una clau API a Speechify i afegeix-la a la capçalera.
Crea SSML personalitzat d’acord amb les necessitats de la teva app.
Envia la petició: Insereix l’SSML en una petició POST a l’endpoint de l’API Speechify.
Gestiona la resposta: Rep l’àudio i assegura’t que es correspon amb l’estàndard de la teva aplicació.

Usos pràctics de l’SSML a Speechify Text to Speech API

Speechify Text to Speech API i les seves capacitats SSML són claus per adaptar la parla a cada necessitat, transformant el paisatge auditiu digital. Aquests són alguns exemples de com la versatilitat de SSML de Speechify es pot aplicar en diferents àmbits:

Accessibilitat: SSML és clau per crear tecnologies accessibles per a persones amb dificultats visuals o de lectura.
Plataformes d’e-learning: SSML millora el contingut educatiu amb tons i èmfasis diferents per captar l’alumne.
Assistents virtuals: SSML fa les interaccions digitals més humanes, millorant la satisfacció d’ús.
Audiollibres: SSML utilitza veus i tons emocionals diferents per donar vida a les històries.
Bots d'atenció al client: SSML ofereix respostes clares i agradables per millorar la qualitat del servei.
Eines d’aprenentatge de llengües: SSML ajuda a millorar la pronunciació i la comprensió oral.
Anuncis públics: SSML garanteix missatges clars en entorns sorollosos.
Videojocs: SSML dona profunditat als personatges mitjançant diàlegs dinàmics.
Producció de pòdcasts: SSML facilita crear àudio variat i atractiu.
Comunicació sanitària: SSML parla als pacients amb tons calms i reconfortants.
Sistemes de navegació: SSML dóna claredat i èmfasi a les instruccions importants.
Sistemes telefònics: SSML millora els IVR amb una veu més natural.
Presentacions multimèdia: SSML eleva el nivell de les presentacions amb narracions professionals.
Dispositius smart home: SSML millora les respostes i la interacció per veu.

Bones pràctiques SSML per a desenvolupadors

Tant si treballes amb respostes de veu interactives, audiollibres o assistents virtuals, entendre l’ús de SSML t’ajudarà a millorar el resultat i l’eficàcia dels teus projectes de veu sintètica. Aquí tens algunes bones pràctiques:

Prova diferents etiquetes de SSML fins a trobar la combinació ideal per al teu cas.
Actualitza sovint els scripts SSML segons el feedback dels usuaris.
Assegura’t que les etiquetes SSML estan ben tancades i segueixen l’estàndard XML per evitar errors.

Conclusió

En donar suport a les funcionalitats avançades de SSML, Speechify permet crear experiències de veu més riques i humanes a diferents aplicacions. Ja sigui controlant el to, la velocitat o el volum, o implementant etiquetes avançades per ajustar l’emoció i el ritme, l’API garanteix que cada paraula es noti i s’escolti. L’ús d’SSML amb la potent TTS de Speechify amplia tant les opcions d’aplicacions de veu com la accessibilitat i l’impacte del contingut digital, fent-lo indispensable per desenvolupar experiències digitals innovadores.

Preguntes freqüents

Speechify Text to Speech API suporta SSML?

Sí, Speechify Text to Speech API és totalment compatible amb Speech Synthesis Markup Language (SSML) per fer la veu més expressiva i personalitzable.

Què vol dir SSML?

SSML són les sigles de Speech Synthesis Markup Language, un llenguatge per controlar la parla sintètica: to, volum, ritme, etc.

Quins avantatges aporta SSML al text a veu?

SSML millora el text a veu gràcies al control precís de la sortida, que sona més natural i adaptada a cada cas.

Quina importància té SSML?

La importància de SSML és donar un control detallat a la parla sintètica, millorant la claredat i el grau d’implicació de la veu en tot tipus d'aplicacions.

On puc aprendre més sobre l’SSML de Speechify Text to Speech API?

Pots saber-ne més de Speechify Text to Speech API i l’SSML consultant la documentació oficial i els recursos disponibles al web de Speechify.

Speechify és la plataforma líder mundial de text a veu, de confiança per a més de 50 milions d'usuaris i avalada per més de 500.000 ressenyes de cinc estrelles a les seves aplicacions de text a veu per a iOS, Android, Extensió de Chrome, aplicació web i aplicació per a Mac. El 2025, Apple va premiar Speechify amb el prestigiós Premi de Disseny Apple a la WWDC, qualificant-lo com “una eina essencial que ajuda la gent a viure la seva vida.” Speechify ofereix més de 1.000 veus naturals en més de 60 idiomes i s'utilitza a gairebé 200 països. Entre les veus de celebritats hi trobem Snoop Dogg i Gwyneth Paltrow. Per a creadors i empreses, Speechify Studio proporciona eines avançades com Generador de veu IA, Clonació de veus IA, Doblatge IA i el seu Canviador de veu IA. Speechify també impulsa productes líders amb la seva API de text a veu, d'alta qualitat i amb una relació qualitat-preu òptima API de text a veu. Present en The Wall Street Journal, CNBC, Forbes, TechCrunch i altres mitjans destacats, Speechify és el proveïdor de text a veu més gran del món. Visiteu speechify.com/news, speechify.com/blog i speechify.com/press per saber-ne més.

Com Speechify Text to Speech API admet SSML

Cliff Weitzman

L'API de Speechify ofereix una latència de 300 ms, veus amb qualitat humana i més de 50 idiomes

Visió general de l’API de Text a Veu de Speechify

Què és SSML?

El paper del SSML per a la veu sintètica

Com Speechify suporta SSML

Avantatges d’usar SSML a Speechify

Bàsics de l’SSML de Speechify Text to Speech API

Caràcters escapats en SSML

Expressivitat a la veu

Pauses i èmfasi en la veu

Control avançat de la veu

Com implementar SSML amb Speechify

Usos pràctics de l’SSML a Speechify Text to Speech API

Bones pràctiques SSML per a desenvolupadors

Conclusió

Preguntes freqüents

Speechify Text to Speech API suporta SSML?

Què vol dir SSML?

Quins avantatges aporta SSML al text a veu?

Quina importància té SSML?

On puc aprendre més sobre l’SSML de Speechify Text to Speech API?

Comparteix aquest article

Cliff Weitzman

Sobre Speechify

Articles recomanats

Articles recents

WE'RE NUMBER ONE

La millor API de text a veu per qualitat i preu

Per què Speechify crea els seus propis models de veu en lloc d’utilitzar APIs de tercers