IBM vardas siejamas su kompiuteriais ir pažangiomis technologijomis. Tai vienas iš tų prekių ženklų kaip Microsoft ar Apple, įstrigusių mūsų galvose. Ne be reikalo – jie kuria moderniausią programinę įrangą, kuri palengvina kasdienybę ir siūlo daugybę naudingų funkcijų.
Viena jų – IBM Watson. Giluminio mokymosi teksto į kalbą programa, kuri bet kokį tekstą paverčia aukštos kokybės garso failu su įvairiais natūraliais balsais. Toliau aptarsime šios programos privalumus ir ar kaina atitinka galimybes.
Kas yra Watson teksto į kalbą?
Paprasčiau tariant, Watson Text to Speech yra debesijoje veikiantis API, sukuriantis natūraliai skambančią kalbą. Tai automatizuoti, dirbtinio intelekto balsai, dirbantys įvairiomis kalbomis. Visi pasakotojai skamba itin natūraliai, beveik nesiskiria nuo tikrų žmonių balsų. Tai patogi, galinga programa, kuriai nereikia specialių mokymų.
Ją galite naudoti kaip virtualų asistentą bendrauti su užsienio partneriais jų kalba ir sutrumpinti klientų aptarnavimo laukimo laiką. Ji didina prieinamumą disleksiją, ADHD ar silpnaregystę turintiems žmonėms. Tačiau apie viską plačiau – toliau.
Funkcijos
Kaip ir visi geri įrankiai, Watson teksto į kalbą siūlo daugybę galimybių. Tai ne tik paprastas kalbos sintezatorius. Ji sugeba gerokai daugiau. Pažiūrėkime pagrindinius privalumus:
Kalbos
Watson Text to Speech palaiko daugiau nei 10 kalbų: anglų, vokiečių, italų, kinų, arabų, portugalų ir kitas. Kitaip nei kai kurios kitos TTS programos, čia galite įkelti tekstą viena kalba, o išgirsti – kita. Ši funkcija ypač naudinga besimokantiems užsienio kalbų.
Redagavimo galimybės
Nors čia nėra labai pažangių redagavimo funkcijų, gausite bazinius pasirinkimus. Vos atsidarę Watson teksto į kalbą programą rasite laukelį, kuriame galite rašyti tekstą ar įklijuoti jau esamą. Po to galima pasirinkti kalbą ir koreguoti balsą.
Galite keisti tarmes ir balsus, parinkti greitį bei toną. Pavyzdžiui, anglų kalbai – amerikietiškas, britiškas ar australiškas akcentas. Tai nėra naujovė, bet daugeliui naudotojų to visiškai pakanka.
Balsų įvairovė
Kaip minėta, kiekviena kalba turi skirtingus balsus. Amerikiečių anglų kalboje galima rinktis net iš 11 AI pasakotojų – nuo Alisson iki Michael, ir kiekvienas turi savų ypatumų. Yra vyriškų ir moteriškų balsų – dalis puikiai tinka e. mokymuisi, kiti labiau pritaikyti linksmam turiniui ar YouTube klipams.
Kuo skiriasi?
Kuo IBM Watson išsiskiria iš kitų TTS programų? Be žinomo vardo, jo balsai labai realistiški – visi neuroniniai. Galite susikurti ir savo balsą, o tai itin aktualu turinio kūrėjams.
Ir tai dar ne viskas. Watson asistentas turi daugiau galimybių – sistema gali prognozuoti žodžių tarimą, kas ypač naudinga siekiant aiškumo ir profesionalumo, kai tekste yra neįprastų žodžių.
Dar viena stiprybė – pasakotojų išraiškingumas. Kiekvienas balsas turi kalbėjimo stilių, pvz., GoodNews, Apology ar Uncertainty. Sujungus tai su tonų, greičio ar garso reguliavimu, gaunate tikrai daug kūrybinės laisvės.
Nauda
Dabar svarbiausias klausimas – kam labiausiai praverčia IBM Watson teksto į kalbą? Naudotojų spektras platus: nuo smulkaus verslo savininkų, siekiančių pagerinti klientų patirtį, iki video kūrėjų socialiniams tinklams ar e. mokymuisi. O ar verta? Pažiūrėkime.
Kainos
Nors tai ne atviro kodo programa, Watson turi nemokamą planą Lite. Jis tiks tiems, kurie šiuo metu negali mokėti už TTS. Galima transkribuoti 10 000 simbolių per mėnesį, naudotis 35 balsais ir rinktis iš 16 kalbų / tarmių.
Taip pat yra planai Standard, Premium ir Deploy Anywhere. Jų kainos skiriasi, dėl detalių galima kreiptis į IBM. Visi jie siūlo neribotą transkripciją, 35 balsus ir visas kalbas bei tarmes. Skirtumas tik integracijoje su kitomis debesijos paslaugomis, pavyzdžiui, Google Cloud.
Speechify
Be Watson, yra ir kitų TTS alternatyvų. Viena populiariausių – Speechify. Ji paremta mašininio mokymosi modeliais, dirbtiniu intelektu ir OCR algoritmais. Galite nufotografuoti tekstą ir Speechify jį perskaitys, o ne tik dirbti su paprastu tekstu.
Speechify siūlo 30+ AI balsų daugiau nei 15 kalbų. Speechify veikia iOS ir Android telefonuose, kaip programa macOS, bei papildinys Chrome ar Safari naršyklėms. Tad išbandykite ir paverskite bet kokį tekstą garsu.
DUK
Ar IBM Watson teksto į kalbą galima naudoti komerciniais tikslais?
Pagal IBM SaaS sutartį Watson TTS galite naudoti tik asmeniniams tikslams – ne komercijai. Pvz., negalite imti mokesčio iš kitų už teksto transkribavimą, naudodami savo Watson licenciją.
Kaip atsisiųsti Watson teksto į kalbą programą?
Pirmiausia susikurkite IBM Cloud paskyrą. Tada būsite nukreipti į atsisiuntimo puslapį, kur galėsite pasirinkti (x64 ar x86) Watson teksto į kalbą versiją savo įrenginiui.

