Osnivač Speechifyja o budućnosti AI-ja u podcastu Everyday AI
Jesu li glasovi slavnih budućnost generativnog AI-ja? Je li AI siguran? Osnivač i direktor Speechifyja, Cliff Weitzman, razgovarao je s Jordanom Wilsonom u 152. epizodi podcasta Everyday AI o ovim i drugim pitanjima.
Podcast Everyday AI
Podcast Everyday AI je popularan i besplatan dnevni livestream, podcast i newsletter koji pomaže ljudima koristiti AI za razvoj karijere. Podcast donosi novosti, savjete i trendove o generativnom AI-ju te uči kako iskoristiti AI za uspjeh. Od travnja 2023. godine, Everyday AI podcast ima 22.000 slušatelja i 7.800 dnevnih pretplatnika newslettera koji žele AI strategije za pametniji rad i veći uspjeh uz umjetnu inteligenciju.
Priča o Speechifyju
Cliff Weitzman je razvio Speechify kada je na fakultetu imao poteškoće s disleksijom i otkrio da većina udžbenika nema zvučne verzije. Danas je to broj 1 text to speech aplikacija u svijetu s više od 150.000 ocjena s 5 zvjezdica i 25+ milijuna korisnika. Čak je i Snoop Dogg poželio surađivati s tvrtkom. O tome i još mnogočemu Weitzman je govorio u 152. epizodi podcasta Everyday AI, objavljenoj 27. studenog.
Kako radi Speechify
Weitzman je objasnio kako Speechify ima najbolji text to speech (TTS) motor s vrhunskim AI generatorom glasova za trenutačnu i pristupačnu pretvorbu teksta u govor. Dostupne su Android, Mac i iOS aplikacije, web verzija te ekstenzije za Microsoft Edge i Google Chrome. Speechify ne čita samo digitalni tekst—poput PDF-ova, vijesti, Google Dokumenata i e-pošte—već uz napredni OCR i AI omogućuje korisnicima snimiti fotografije udžbenika, bilješki i pretvoriti ih u zvuk u stvarnom vremenu.
Upotrebe i cilj Speechifyja
Slušanjem teksta umjesto čitanja ili uz opciju označavanja u Speechifyju, korisnici brže i lakše usvajaju informacije. Zato je Speechify nezamjenjiv alat za studente i sve osobe s teškoćama u učenju—disleksija, ADHD, slab vid, sljepoća, autizam, potresi mozga, anksioznost.
Iako se isprva koristio kao pomoćna tehnologija za osobe s teškoćama u učenju, danas ga koriste svi, kaže Weitzman: liječnici, pravnici, računovođe, vojska, direktori, financijaši, učenici jezika i svi multitaskeri koji žele veću produktivnost i brzinu čitanja, zahvaljujući prirodnim glasovima i OCR tehnologiji.
Weitzman je rekao kako je cilj Speechifyja da "čitanje nikome ne bude prepreka učenju, bez obzira na pozadinu."
Glasovi slavnih
Kako je Speechify rastao, partnerstva sa slavnim osobama postala su moguća. U epizodi su Weitzman i Wilson pričali o suradnji sa Snoop Doggom, čiji se glas koristi među brojnim govornim opcijama Speechifyja.
Weitzman kaže da su mnoga partnerstva ostvarena jer su poznati korisnici sami kontaktirali tvrtku. Tako je i Snoop Doggov agent kontaktirao Speechify, rekavši da Snoop želi dati svoj glas kako bi svojoj publici olakšao usvajanje informacija. Weitzman je zato snimao u Snoopovom studiju za kloniranje glasa i sintezu govora.
Od 200+ AI glasova na raznim jezicima, uključujući engleski, kineski, španjolski, portugalski i druge, jedan od glasova u ponudi je i glas glumice i dugogodišnje investitorice u Speechify Gwyneth Paltrow.
Uz ove glasove slavnih, koji mogu čitati sve, od objava na društvenim mrežama do znanstvenih radova, Speechify primjenjuje zaštitne mjere protiv zloupotrebe.
Sigurnost AI-ja i kloniranje glasa
Iako Speechify prepoznaje prednosti AI text to speech alata i tehnologije kloniranja glasova, Weitzman ističe da je jedna od glavnih briga zaštita stvaratelja sadržaja i korisnika jer je „AI sigurnost izuzetno važna“.
Sigurnosne politike još su važnije sada kad Speechify širi mogućnosti text to speech tehnologije, uključujući nove proizvode poput Speechify Studija—AI alata za voiceover, izradu i prijevod, transkripciju, uređivanje videa i AI avatare.
Primjerice, Weitzman navodi da korisnici smiju klonirati samo vlastiti glas ili glas osobe do sebe, uz njezin pristanak, radi zaštite od zlouporabe i povrede identiteta ili autorskih prava.
“Naša filozofija u Speechifyju daje vlasnicima prava kontrolu,” rekao je Weitzman. Dodao je kako AI tehnologija Speechifyja nije stvorena da zamijeni stvaratelje, poput naratora knjiga, već da im pomogne efikasnije stvarati više sadržaja.
Weitzman još otkriva da Speechify razvija proizvod koji će korisnicima olakšati prepoznati je li glas ljudski ili AI-generiran i, ako je lažan, gdje je nastao – zaštita protiv AI prevara u kojima netko imitira glas bliske osobe.
Poslušajte Cliffa Weitzmana u podcastu Everyday AI
Saznajte više o tome kako Speechifyjev AI mijenja budućnost učenja i stvaranja sadržaja—poslušajte ovu posebnu epizodu podcasta Everyday AI na svim glavnim platformama poput Apple Podcasts i Spotifyja ili u nastavku:
Vremenski kodovi epizode:
[00:12:50] Sigurnost u text to speech prostoru
[00:18:12] Primjene za text to speech
[00:21:05] Pitanja slušatelja
[00:24:10] Budućnost text to speech tehnologije
[00:27:28] Je li pisana riječ manje utjecajna?
[00:31:30] Kako profesionalci koriste text to speech

