Teksto skaitymas (TTS) yra nepakeičiama pagalbinė technologija, padedanti daugeliui naudotojų skaityti tekstą pramogai, mokslui ar darbui.
Kaip ir galima tikėtis, TTS sprendimų rinkoje gausu — siūloma daugybė programėlių ir naršyklės plėtinių. Dauguma jų naudingi, didina produktyvumą ir suteikia patogesnę patirtį. Šiandien aptarsime Microsoft TTS sprendimą — Azure.

Kas yra Microsoft teksto skaitymas?
Kas tas Azure? Paprastai tariant, jei norite kurti natūraliai skambančius įgarsinimus ar klausytis tekstų su gausybe reguliuojamų nustatymų — kalbos greičiu, tonais, tarimu ir t.t. — Microsoft Azure tai leidžia ir dar daugiau.
Azure — tai debesų platforma su daugybe galimybių. Azure kognityvinės paslaugos siūlo puikų teksto skaitymą ir balso atpažinimą, o Azure debesų saugykla ir analizės įrankiai leidžia dirbti efektyviau — ir nereikia gilintis į sudėtingą mašininį mokymą.
Azure suderinamas su atvirojo kodo sprendimais, todėl labai lankstus. Integruoti įgarsinimus į savo programas ir išnaudoti gilųjį mokymą dabar lengva — ypač kai Azure siūlo daugiau nei šimtą kalbų ir jų variantų.
Kaip naudotis Microsoft teksto skaitymo funkcija iPhone ar kompiuteryje
Microsoft Azure įsidiegti įrenginyje paprasta — tereikia per kelis paspaudimus užsiregistruoti oficialioje Azure svetainėje. Tačiau jei naudojate tik Outlook, Word, PowerPoint, Docs ir OneNote, nieko diegti nereikės — šiose programose jau integruotas „Speak“ teksto skaitymas.
Nors tai nėra aukščiausios kokybės paslauga, „Speak“ labai praverčia ir lengvai sukonfigūruojama, kai reikia greito sprendimo:
- Spustelėkite parinktį „Customize Toolbar“
- Pasirinkite „More Commands“
- Spustelėkite „All Commands“
- Raskite „Speak“, spustelėkite ir pasirinkite „Add“
Alternatyvos Microsoft teksto skaitymui
Kaip minėjome įžangoje, teksto skaitymo įrankių yra gausybė — nuo profesionalių programų iki nebaigtų SDK GitHub’e. Jei Microsoft teksto skaitymas jums netinka ar norite daugiau pasirinkimų, turime keletą puikių alternatyvų.
Speechify
Pirmoje vietoje — Speechify — vienas geriausių TTS įrankių, kuris paverčia beveik bet ką į garso failus: tinklalapius, Google Docs, straipsnius, užrašus ar nuotraukas naudojant OCR. Yra mobilios programėlės — iOS ir Android, Web, Mac, Windows, Chrome plėtinys ir teksto skaitymo API.
Be to, Speechify siūlo per 1 000 natūralių ir emociškai AI balsų daugiau nei 60 kalbų, įskaitant garsenybių balsus. Pridėkite galingą teksto skaitymo API ir gaunate universalų sprendimą įvairiems poreikiams bei atvejams.
Amazon Polly
Antroje vietoje — Amazon Polly, puikus sprendimas, žinomas dėl natūralių balsų ir įvairių kalbėjimo stilių. Jis palaiko kelias kalbas, o neuroninio TTS dėka galima reguliuoti daugybę nustatymų ir suasmeninti įgarsinimą.
Google Cloud Text to Speech
Trečioje vietoje — Google Cloud Text to Speech. Kur technologijos juda į priekį, ten ir Google. TTS srityje Google remiasi SSML (Speech Synthesis Markup Language) ir kainodara pagal simbolius, tad tai naudinga ir pigi galimybė vienkartiniams projektams.
IBM Watson Text to Speech
Ketvirtoje vietoje — IBM Watson. Watson išsiskiria universalumu verslo aplinkoje: jis gali veikti kaip virtualus asistentas, pagalbos įrankis ar teksto skaitytuvas. Taip pat labai patraukliai kainuoja, todėl puikiai tinka ieškantiems lanksčių sprendimų.
Readspeaker
Penktoje vietoje — veteranas Readspeaker. Sukaupęs apie 25 m. patirtį, Readspeaker TTS ištobulintas iki meno. Jis palaiko daugiau nei 100 kalbų ir puikiai tinka studijoms ar e. mokymuisi, veikia tiek internetu, tiek neprisijungus.
NaturalReader
Šeštoji — NaturalReader. Ji puikiai sintetina kalbą realiuoju laiku ir veikia beveik su visomis PC programomis. Išskirtinumas — „skaitytojo režimas“, kuris išvalo tekstą nuo reklamų ir kitų nereikalingų elementų.
VoiceDream Reader
Septintą vietą užima VoiceDream Reader — paskutinė šio sąrašo Microsoft Azure teksto skaitymo alternatyva. Ji tinkama paprastoms užduotims, tačiau trūksta prieinamumo ir sinchronizavimo galimybių. Jei jums reikia greito sprendimo ir pakanka bazinių funkcijų — verta išbandyti.
DUK
Ar Windows 10 TTS nemokamas?
Windows 10 yra daug TTS sprendimų. Kai kurie jų nemokami, kiti — mokami. Integruota „Speak“ funkcija, veikianti Outlook ar Word, yra nemokama, bet pažangesnėms funkcijoms — pvz., neuroniniams balsams Azure platformoje — reikalinga prenumerata.
Kuris TTS balsas realiausias?
Realiausi TTS AI balsai būdingi sudėtingesniems TTS įrankiams, pvz., Amazon Polly, Google Text to Speech API ir Speechify. Realumo lygis priklauso nuo kalbos, modelio ir pasirinktų parametrų.
Kuo skiriasi teksto skaitymas ir balso atpažinimas?
Daugelis TTS programų siūlo tiek teksto skaitymą, tiek balso atpažinimą, tačiau šių funkcijų painioti nereikėtų. Teksto skaitymas konvertuoja tekstą į garsą — patogu, kai norite klausydamiesi nuveikti ką nors kita. Balsų atpažinimas analizuoja žmogaus balsą, siekdamas jį interpretuoti ar atpažinti.

