Zakladateľ Speechify o budúcnosti AI v podcaste Everyday AI
Sú hlasy celebrít budúcnosťou generatívnej AI? Je AI bezpečná? Zakladateľ a CEO Speechify Cliff Weitzman sa porozprával s Jordanom Wilsonom v epizóde 152 podcastu Everyday AI a rozobrali tieto otázky aj ďalšie témy.
Podcast Everyday AI
Podcast Everyday AI je populárny bezplatný denník, podcast a newsletter, ktorý pomáha ľuďom posúvať kariéru vďaka AI. Prináša najnovšie tipy a trendy zo sveta generatívnej AI a radí, ako AI využiť na úspech. Od apríla 2023 podcast Everyday AI podporuje 22 000 poslucháčov a 7 800 odberateľov e-mailov, ktorí chcú získať AI poznatky a stratégie na efektívnejšiu prácu aj učenie s umelou inteligenciou.
Príbeh Speechify
Cliff Weitzman vytvoril Speechify počas štúdia na vysokej škole, keď bojoval s dyslexiou a zistil, že väčšina učebníc nemá audioknihy. Dnes je to č. 1 prevod textu na reč aplikácia na svete, s viac ako 150 000 päťhviezdičkovými hodnoteniami a 25+ miliónmi používateľov. Ako sa stala taká populárna, že sa zapojil aj Snoop Dogg? Weitzman to rozoberá v 152. epizóde podcastu Everyday AI, ktorý vyšiel v pondelok 27. novembra.
Ako Speechify funguje
Weitzman vysvetlil, že Speechify je postavený na špičkovom prevodníku textu na reč (TTS) s najkvalitnejším AI generátorom hlasu na svete, ktorý rýchlo a dostupne premení akýkoľvek text na reč. S aplikáciou pre Android, Mac, iOS a vo webovej verzii, aj cez rozšírenia Microsoft Edge a Google Chrome, Speechify nečíta len digitálne texty ako PDF, články, Google Docs či e-maily. Pomocou pokročilého OCR a AI technológie môžu používatelia odfotiť učebnice, poznámky či iné dokumenty a v reálnom čase ich rýchlo premeniť na realistické audio súbory.
Použitie & cieľ Speechify
Umožňuje počúvať text namiesto čítania alebo čítať a počúvať naraz vďaka zvýrazňovaniu – používatelia tak prijímajú informácie rýchlejšie a efektívnejšie. Speechify je nepostrádateľný AI nástroj pre študentov a ľudí s poruchami učenia, ako je dyslexia, ADHD, slabý zrak, slepota, autizmus, otrasy či úzkosť.
Hoci bol Speechify spočiatku hlavne pomocnou technológiou pre osoby s poruchami učenia, dnes ho používa široké spektrum ľudí – podľa Weitzmana lekári, právnici, účtovníci, vojaci, manažéri, finančníci, ľudia učiaci sa jazyky aj multitaskeri. Vďaka prirodzeným hlasom a špičkovému OCR zvyšujú svoju produktivitu a rýchlosť čítania.
Weitzman prezradil, že cieľom Speechify je zabezpečiť, aby "čítanie nikdy nebolo pre nikoho prekážkou v učení, bez ohľadu na pôvod.”
Hlasy celebrít
Ako Speechify rástol, mal príležitosť spolupracovať so známymi celebritami. V epizóde Weitzman s Wilsonom rozoberajú partnerstvo so Snoop Doggom, ktorý prepožičal Speechify svoj hlas do širokej ponuky hlasov.
Weitzman vysvetlil, že mnohé partnerstvá vznikajú tak, že sa na Speechify obrátia samotní používatelia produktu. Povedal, ako Snoop Doggov agent kontaktoval Speechify, pretože Snoop chcel svojím hlasom pomôcť publiku lepšie vnímať informácie. Weitzman preto letel do Snoopovho štúdia nahrať a nasimulovať jeho hlas cez klonovanie hlasu a technológiu syntézy reči.
Medzi vyše 200+ AI hlasmi v rôznych jazykoch vrátane angličtiny, čínštiny, španielčiny, portugalčiny a ďalších je aj hlas herečky a dlhodobej investorky Speechify Gwyneth Paltrow ako jedna z možností narátorov.
Pri týchto celebritných hlasoch, ktoré dokážu čítať všetko od postov po štúdie, Speechify zároveň zavádza opatrenia na zabránenie zneužitiu.
Bezpečnosť AI & klonovanie hlasu
Hoci si Speechify uvedomuje prínos AI nástrojov na prevod textu na reč a klonovanie hlasu, Weitzman zdôraznil, že jednou z priorít Speechify je ochrana tvorcov a používateľov, pretože „bezpečnosť AI je mimoriadne dôležitá“.
Zavedenie bezpečnostných politík je ešte dôležitejšie s rozšírením Speechify na nové produkty ako Speechify Studio – AI nástroje umožňujúce tvorcom vytvárať AI voice over, vlastné hlasy, prekladať, automaticky prepísať zvuk, strihať videá a používať AI avatary.
Weitzman uvádza, že Speechify povoľuje klonovať len vlastný hlas alebo hlas prítomného človeka, ktorý udelil súhlas, nie hlas hocikoho z internetu – na ochranu pred zneužitím a porušením identity či autorských práv.
„Naša filozofia v Speechify dáva majiteľom práv plnú kontrolu," povedal Weitzman. Dodáva, že AI technológia nemá nahradiť tvorcov, ako sú narátori audiokníh, ale rozšíriť ich možnosti – napríklad im pomôcť tvoriť viac a rýchlejšie.
Weitzman tiež prezradil, že Speechify vyvíja produkt, ktorý rozlíši, či ide o ľudský hlas alebo AI syntetický hlas, a ak je falošný, ukáže pôvod jeho vzniku – ochrana proti podvodom, kde podvodníci z nekalých dôvodov napodobnia hlas blízkeho.
Vypočujte si Cliffa Weitzmana v podcaste Everyday AI
Ak chcete zistiť viac o tom, ako Speechify AI mení vzdelávanie aj tvorbu obsahu, vypočujte si špeciálnu epizódu podcastu Everyday AI na hlavných platformách ako Apple Podcasts a Spotify alebo nižšie:
Časové značky podcastu:
[00:12:50] Bezpečnosť pri texte na hlas
[00:18:12] Použitie prevodu textu na reč
[00:21:05] Otázky publika
[00:24:10] Budúcnosť textu na reč
[00:27:28] Stráca písané slovo vplyv?
[00:31:30] Prevod textu na reč pre profesionálov

