Основателят на Speechify обсъжда бъдещето на ИИ в подкаста Everyday AI
Дали гласовете на знаменитости са бъдещето на генеративния изкуствен интелект? Безопасен ли е ИИ? Основателят и изпълнителен директор на Speechify Клифф Уайтцман разговаря с Джордан Уилсън в епизод 152 на подкаста Everyday AI, за да обсъдят тези въпроси и още куп други теми.
Подкаст Everyday AI
Подкастът Everyday AI е популярен безплатен ежедневен livestream, подкаст и нюзлетър, който помага на обикновените хора да развиват кариерите си с помощта на изкуствен интелект. Той не само държи слушателите в течение с най-новите съвети и тенденции в бързоразвиващия се свят на генеративния ИИ, но и им показва как на практика да използват ИИ успешно. Откакто стартира през април 2023 г., подкастът Everyday AI е събрал 22 000 слушатели и 7 800 абонати на ежедневния нюзлетър, които искат да почерпят прозрения и стратегии за ИИ, за да работят по-умно, а не по-усърдно, и да издигнат успеха си на ново ниво с помощта на изкуствения интелект.
Историята на Speechify
Клифф Уайтцман първоначално създава Speechify, след като среща трудности с дислексията по време на университета и осъзнава, че повечето учебници нямат аудиоверсии. Днес това е №1 текст към реч апликация в света, с над 150 000 петзвездни отзиви и повече от 25 милиона потребители. Как стана толкова популярна, че дори Snoop Dogg поиска партньорство с компанията? Уайтцман разказва за това и много други неща в епизод 152 на подкаста Everyday AI, излъчен в понеделник, 27 ноември.
Как работи Speechify
Уайтцман обясни, че Speechify стъпва върху най-добрия двигател за текст към реч (TTS) с най-високо качество AI гласов генератор в света, който мигновено и достъпно преобразува всеки текст в реч. С наличието на приложения за Android, Mac и iOS, уеб версия, както и разширения за Microsoft Edge и Google Chrome, Speechify далеч не се изчерпва само с четене на дигитални текстове на глас, като PDF-и, новинарски статии, Google Docs и имейли. Използвайки напреднали OCR и AI технологии, потребителите могат за секунди да снимат учебници, помагала, ръкописни бележки и други физически документи и да ги превръщат в реалистични аудиофайлове в реално време.
Приложения и мисия на Speechify
Като позволява на потребителите да слушат текста вместо да го четат, или да слушат, докато четат с функцията за маркиране на текст в Speechify, те могат да възприемат информацията по-бързо, по-лесно и по-ефективно. Това превръща Speechify в незаменим AI инструмент за студенти и хора с обучителни затруднения или увреждания като дислексия, ADHD, слабо зрение, слепота, аутизъм, мозъчни сътресения и тревожност.
Въпреки че в началото Speechify се използваше основно като помощна технология за хора с обучителни затруднения, днес го използват хора от всякакви среди, включително, по думите на Уайтцман, лекари, адвокати, счетоводители, военни, мениджъри, финансисти, хора, изучаващи езици, и всички, които искат да повишат продуктивността си и скоростта си на четене, благодарение на висококачествените естествени гласове и OCR технологията.
Всъщност Уайтцман сподели, че целта на Speechify е да гарантира „четенето никога да не бъде пречка за учене за никого, независимо от предисторията.“
Гласове на знаменитости
С разрастването на Speechify се появиха възможности за партньорство с известни личности. В епизода Уайтцман и Уилсън обсъждат как Speechify успява да си сътрудничи със Snoop Dogg, който предоставя гласа си като една от опциите в богатия набор от гласове в Speechify.
Уайтцман обясни, че много от партньорствата на Speechify възникват, когато хора, които вече използват продукта, се свързват с тях. Той разказва как агентът на Snoop Dogg се свързал със Speechify и обяснил, че Snoop иска да използва гласа си, за да помага на аудиторията си да възприема информация. Това води до пътуване на Уайтцман до студиото на Snoop Dogg, за да запише и възпроизведе гласа му чрез клониране на глас и технологии за синтез на реч.
Сред над 200 AI гласа на Speechify на различни езици – включително английски, китайски, испански, португалски и други – гласът на актрисата и дългогодишен инвеститор в Speechify Гуинет Полтроу също е опция за разказвач в приложението за текст към реч.
Но редом с тези гласове на знаменитости, които могат да четат всичко – от публикации в социалните мрежи до научни статии – Speechify въвежда и мерки за сигурност, за да предотврати злоупотреби.
Безопасност на ИИ и клониране на глас
Макар Speechify да признава ползите от инструментите за преобразуване на текст в реч чрез ИИ и технологиите за клониране на глас, Уайтцман подчерта, че една от най-важните грижи на Speechify е защитата на създателите на съдържание и на хората, защото „безопасността на ИИ е изключително важна“.
Въвеждането на политики за безопасност стана още по-ключово, след като Speechify разшири функционалността си за текст към реч и пусна нови продукти като Speechify Studio – комплект AI инструменти, който позволява на създателите на съдържание да създават AI озвучавания, персонализирани гласове, да превеждат озвучавания, автоматично да транскрибират работата си, да редактират видеа и да използват AI аватари.
Например, Уайтцман обяснява, че Speechify позволява на потребителите да клонират само собствения си глас или глас до тях, като този на приятел, който е дал съгласие – не всеки глас от интернет – за да се предотвратят злоупотреби, както и кражба на самоличност или авторски права.
„Философията ни в Speechify като цяло поставя собственика на правата зад волана,” каза Уайтцман. Той също така подчерта, че AI технологията на Speechify не е предназначена да замени създателите на съдържание като актьорите, които четат аудиокниги, а да „разшири [тяхната] способност да създават“, като им помага да произвеждат повече съдържание по-ефективно.
Освен това Уайтцман разкри, че в момента Speechify работи по продукт, който ще позволява на потребителите лесно да разпознават дали гласът е човешки или е синтетично генериран от ИИ, и ако е фалшив – откъде точно е създаден първоначално. Това ще помогне да се предотвратят измами с глас, при които злонамерени лица използват модификатор на глас, за да имитират гласа на близък човек с измамни цели.
Чуйте Клифф Уайтцман в подкаста Everyday AI
За да научите повече за това как AI технологията за текст към реч на Speechify оформя бъдещето на ученето и създаването на съдържание, чуйте този специален епизод на подкаста Everyday AI в основните платформи като Apple Podcasts и Spotify или го слушайте по-долу:
Времеви маркери на подкаста:
[00:12:50] Безопасност в сферата на текст към глас
[00:18:12] Приложения за текст към реч
[00:21:05] Въпроси на аудиторията
[00:24:10] Бъдещето на текст към реч
[00:27:28] Става ли писаната дума все по-малко въздействаща?
[00:31:30] Използване на текст към реч от професионалисти

