IBM е напълно синоним на компютрите и съвременните технологии. Това е една от онези марки като Microsoft и Apple, които са се запечатали в съзнанието ни. И то с основателна причина. Те създават едни от най-качествените софтуерни решения, които ни предоставят множество полезни функции за по-лесно и удобно ежедневие.
Една от тези технологии определено е IBM Watson. Това е приложение за преобразуване на текст в реч, базирано на дълбоко обучение, което може да превърне всяко писмено съдържание във висококачествен аудио файл с различни, реалистично звучащи гласове. Затова в следващите редове ще разгледаме всички особености на това приложение и ще видим как се вписва спрямо ценовите си планове.
Какво е Watson текст към реч?
По същество Watson Text to Speech е облачно API за обработка на естествен език. То автоматизира гласове, генерирани от AI, които работят на различни езици. Всички тези разказвачи звучат естествено и почти не се различават от истински човешки гласове. Страхотен софтуер с отлична функционалност и без нужда от учебни ръководства.
Можете да го използвате като виртуален асистент, за да комуникирате с чуждестранни партньори на техния роден език, както и да намалите или премахнете времето за изчакване при обслужване на клиенти. Освен това увеличава достъпността за хора с дислексия, СДВХ или нарушено зрение. Но да не избързваме. Ще обсъдим неговите приложения и предимства след малко.
Функции
Както всички страхотни приложения, Watson текст към реч има много какво да предложи на своите потребители. Не е просто инструмент за преобразуване на текст в говор в реално време. Може много повече от това. Нека видим някои от най-отличаващите се функции.
Езици
Watson Text to Speech поддържа над 10 различни езика. Сред тях са английски, немски, италиански, китайски, арабски и португалски. За разлика от някои други TTS приложения, тук можете да импортирате текст на един език и приложението да го прочете на друг. Това е изключително полезна функция за хора, които изучават чужди езици.
Възможности за редактиране
Въпреки че това не е софтуер за редактиране, все пак имате някои основни възможности за промени чрез SDK. Например, щом отворите приложението Watson текст към реч, ще видите диалогов прозорец, в който да започнете да пишете или да поставите вече готов текст. След това можете да изберете език и да поиграете с настройките за глас.
Можете да избирате различни диалекти и гласове, както и скорост и тоналност. Например за английски има американски, британски и австралийски акценти. Това не е нещо революционно сред TTS приложенията днес, но със сигурност е напълно достатъчно, за да удовлетвори средния потребител.
Видове гласове
Както споменахме, за всеки език има различни гласове. Например за американския английски може да избирате между 11 AI разказвачи. От Алесон до Майкъл – всички те имат уникални характеристики. Освен че са мъжки или женски, някои са по-подходящи за образователни е-обучения, докато други са по-жизнени и са идеални за YouTube видеа.
С какво се отличава?
И така, с какво IBM Watson се различава от другите опции на пазара за TTS? Освен марката, това приложение действително има много добри AI гласове – всички са невронни, тоест звучат по-реалистично. Освен това можете да създавате и собствен глас, което е много полезно за създатели на съдържание.
Но това не е всичко. Този Watson асистент има още какво да предложи. Можете да задавате и предвиждате произношението на думите. Това е полезна функция за уточняване на необичайни термини и ще направи текста ви да звучи по-професионално.
Освен това всяко повествование може да бъде с различен стил на изговаряне, включително GoodNews, Apology и Uncertainty. В комбинация с регулируемата височина, сила и скорост на гласа резултатът става доста впечатляващ.
Предимства от използването
Всичко това ни води до най-важния въпрос – кой има най-голяма полза от IBM Watson текст към реч? Много хора: от малки бизнеси, които искат да подобрят потребителското изживяване с чатбот, до хора, които създават видеа за социални медии или електронно обучение. Инструмент е за всеки. Но заслужава ли си? Нека видим.
Цени
Въпреки че Watson не е приложение с отворен код, то има безплатна версия, наречена Lite. Чудесно решение за всеки, който в момента не може да отдели средства за TTS софтуер. Можете да транскрибирате 10 000 знака на месец, да използвате 35 гласа, а езиците и диалектите са 16 на брой.
Освен това са налични планове Standard, Premium и Deploy Anywhere. Техните цени са различни, така че можете да се свържете с IBM за подробности. Всички включват неограничено транскрибиране, 35 гласа и всички езици и диалекти. Единствената разлика между тях е интеграцията с външни облачни услуги като Google Cloud.
Speechify
Разбира се, освен Watson има и други предложения на пазара за текст към реч. Едно от най-популярните приложения е Speechify и определено си заслужава вниманието. Базирано е на машинно обучение, изкуствен интелект и OCR алгоритми. В комбинация това ви позволява да снимате текст и Speechify да го прочете на глас – освен обичайната транскрипция.
Speechify предлага над 30 AI гласа, които говорят на повече от 15 различни езика. Приложението е налично за iOS и Android смартфони, като приложение за компютри с macOS и като плъгин за браузърите Google Chrome и Safari. Така че пробвайте го и превърнете всеки текст в аудио.
Често задавани въпроси
Можете ли да използвате IBM Watson текст към реч за комерсиални цели?
Съгласно SaaS договора, който сключвате с IBM, имате право да използвате Watson TTS само за лична употреба, а не за комерсиални цели. Например не можете да таксувате други хора, за да транскрибирате техните текстове с вашата лицензирана версия на Watson.
Как да изтегля приложението Watson текст към реч?
Първо трябва да си създадете IBM cloud акаунт. След като направите това, ще бъдете пренасочени към страницата за изтегляне, откъдето ще можете да изберете версията (x64 или x86) на Watson текст към реч, подходяща за вашето устройство.

