Ustanovitelj Speechifyja o prihodnosti AI v podcastu Everyday AI
So zvezdniški glasovi prihodnost generativne AI? Je AI varna? Ustanovitelj in direktor Speechifyja Cliff Weitzman se je v 152. epizodi podcasta Everyday AI z Jordanom Wilsonom lotil teh in drugih vprašanj.
Podcast Everyday AI
Podcast Everyday AI je priljubljen, brezplačen dnevni livestream, podcast in novičnik, ki ljudem pomaga pri karierni rasti z umetno inteligenco. Oddaja poslušalcem prinaša najnovejše trike in trende hitro rastočega področja generativne AI ter pokaže, kako jo lahko uporabijo za uspeh. Od začetka v aprilu 2023 podcast Everyday AI šteje 22.000 poslušalcev in 7.800 naročnikov na e-novičnik, ki želijo osvojiti AI znanje in strategije za pametnejše delo ter večji uspeh z umetno inteligenco.
Zgodba Speechifyja
Cliff Weitzman je Speechify sprva ustvaril zaradi svojih težav z disleksijo med študijem in spoznal, da večina učbenikov nima zvočnih knjig. Danes je to #1 program za pretvorbo besedila v govor na svetu, z več kot 150.000 ocenami s petimi zvezdicami in 25+ milijoni uporabnikov. Kako je postal tako priljubljen, da je želel sodelovati celo Snoop Dogg? Weitzman je o tem in še več govoril v 152. epizodi, ki je izšla v ponedeljek, 27. novembra.
Kako deluje Speechify
Weitzman je pojasnil, da je Speechify grajen na vrhunskem pogonu za pretvorbo besedila v govor (TTS) in najboljšem AI ustvarjalniku glasov na svetu, ki vsak tekst hitro in ugodno spremeni v govor. Speechify je na voljo kot aplikacija za Android, Mac, iOS, v spletni različici ter kot razširitev za Microsoft Edge in Google Chrome, kar omogoča glasno branje digitalnih besedil, kot so PDF-ji, članki, Google dokumenti ali e-pošta. Z napredno OCR in AI tehnologijo pa lahko uporabniki fotografirajo učbenike, zapiske in druge fizične dokumente ter jih v realnem času pretvorijo v naravne zvočne datoteke.
Uporaba in cilj Speechifyja
Poslušanje besedila namesto branja ali hkratno branje z označevanjem v Speechifyju omogoča hitrejše, lažje in učinkovitejše učenje. Zato je Speechify nepogrešljivo orodje za študente in tiste s posebnimi potrebami, kot so disleksija, ADHD, slabovidnost, slepota, avtizem, poškodbe možganov in tesnoba.
Čeprav so Speechify sprva uporabljali predvsem za podporo pri učenju oseb z motnjami, ga zdaj uporablja zelo raznolika skupina ljudi – po Weitzmanu med uporabniki najdemo zdravnike, pravnike, računovodje, vojake, menedžerje, finančnike, jezikovne učence in vse, ki želijo večjo produktivnost in hitrejše branje zahvaljujoč kakovostnemu, naravnemu govoru ter OCR tehnologiji.
Weitzman je razkril, da je cilj Speechifyja, da »branje nikoli ne bo ovira pri učenju, ne glede na tvoje ozadje«.
Zvezdniški glasovi
Z rastjo Speechifyja so se odprle možnosti sodelovanja z znanimi osebnostmi. V epizodi sta Weitzman in Wilson govorila o tem, kako je Speechify sodeloval s Snoop Doggom, ki je posodil svoj glas kot eno od številnih možnosti.
Weitzman pojasnjuje, da veliko partnerstev nastane, ko ljudje izdelek najprej sami uporabljajo in se nato oglasijo. Opiše, kako se je oglasil agent Snoop Dogga, saj je Snoop želel svojemu občinstvu pomagati do boljšega dostopa do informacij s svojim glasom. Zato je Weitzman odpotoval v Snoopov domači studio, kjer sta posnela in ustvarila njegov glas prek kloniranja glasov in sinteze govora.
Med 200+ AI glasovi Speechifyja v različnih jezikih, med drugim angleščini, kitajščini, španščini in portugalščini, je tudi glas igralke Gwyneth Paltrow, dolgoletne investitorke Speechifyja, kot ena od možnosti bralca besedil.
Ob zvezdniških glasovih, ki lahko berejo vse od objav na družbenih omrežjih do znanstvenih člankov, pa Speechify uvaja tudi varnostne ukrepe proti zlorabam.
Varnost AI in kloniranje glasov
Čeprav Speechify prepoznava koristi AI orodij za pretvorbo besedila v govor in kloniranje glasov, Weitzman razloži, da je ena največjih skrbi zaščita ustvarjalcev in ljudi, saj je »varnost AI zelo pomembna«.
Uveljavljanje varnostnih pravil je še pomembnejše, odkar je Speechify razširil svoje funkcije s produkti, kot je Speechify Studio – nabor AI orodij, ki ustvarjalcem omogoča ustvarjati AI voiceoverje, svoje glasove, prevajati posnetke, samodejno prepisovati, urejati videe in uporabljati AI avatarje.
Weitzman pojasni, da Speechify dovoljuje kloniranje le lastnega glasu ali glasu prijatelja z njegovim soglasjem, ne pa kar poljubnih glasov z interneta, s čimer se zaščiti pred zlorabami, krajo identitete ali kršitvami avtorskih pravic.
»Naša filozofija pri Speechifyju daje pravice ustvarjalcem,« pravi Weitzman. Dodaja, da namen AI tehnologije ni zamenjati ustvarjalcev, kot so snemalci audioknjig, temveč jim »povečati ustvarjalnost«, na primer za hitrejše delo.
Weitzman tudi razkrije, da Speechify razvija produkt, ki bo uporabnikom omogočal zlahka prepoznati, ali je glas človeški ali AI sintetičen in – če je ponaredek – kje je bil ustvarjen. Tako bodo ljudje lažje prepoznali prevarantske glasovne posnetke, kjer nepridipravi posnemajo bližnje s pomočjo spreminjevalcev glasu.
Prisluhnite Cliffu Weitzmanu v podcastu Everyday AI
Če vas zanima, kako Speechifyjeva AI za branje besedila spreminja prihodnost učenja in ustvarjanja vsebin, prisluhnite posebni epizodi podcasta Everyday AI na glavnih platformah, kot sta Apple Podcasts ali Spotify, ali jo poslušajte spodaj:
Časovnica podcasta:
[00:12:50] Varnost pri pretvorbi besedila v govor
[00:18:12] Uporaba pretvorbe besedila v govor
[00:21:05] Vprašanja občinstva
[00:24:10] Prihodnost pretvorbe besedila v govor
[00:27:28] Ali pisana beseda izgublja moč?
[00:31:30] Uporaba pretvorbe besedila v govor pri poklicih

