Fondatorul Speechify discută despre viitorul AI în podcastul Everyday AI
Sunt vocile celebrităților viitorul AI generativ? Este AI-ul sigur? Fondatorul și CEO-ul Speechify, Cliff Weitzman, s-a întâlnit cu Jordan Wilson pentru Episodul 152 al podcastului Everyday AI pentru a discuta aceste întrebări și multe altele.
Podcastul Everyday AI
Podcastul Everyday AI este un livestream zilnic popular, podcast și newsletter gratuit care ajută oameni din toate domeniile să își dezvolte cariera cu ajutorul AI-ului. Podcastul nu doar că îi ține la curent pe ascultători cu cele mai recente sfaturi și tendințe din domeniul AI-ului generativ, ci îi și ajută să înțeleagă cum pot folosi AI-ul pentru a avea succes. De la lansarea sa în aprilie 2023, podcastul Everyday AI a adunat 22.000 de ascultători și 7.800 de abonați la newsletter-ul zilnic care vor să descopere perspective și strategii AI pentru a lucra mai inteligent, nu mai mult, și pentru a-și duce succesul la un nou nivel cu ajutorul inteligenței artificiale.
Povestea Speechify
Cliff Weitzman a dezvoltat inițial Speechify după ce s-a confruntat în facultate cu dislexia și a descoperit că majoritatea manualelor nu au versiuni audio. Astăzi, este aplicația #1 text-to-speech din lume, cu peste 150.000 de recenzii de cinci stele și peste 25 de milioane de utilizatori. Cum a ajuns atât de populară încât chiar și Snoop Dogg a vrut să colaboreze cu compania? Weitzman a discutat despre acest subiect și multe altele în Episodul 152 al podcastului Everyday AI, lansat luni, 27 noiembrie.
Cum funcționează Speechify
Weitzman a explicat cum Speechify este construit pe cel mai bun motor text-to-speech (TTS), cu cel mai înalt nivel de calitate al generatorului vocal AI din lume, pentru a transforma orice text în vorbire, instantaneu și accesibil. Cu aplicații pentru Android, Mac, iOS, versiune web, dar și extensii pentru Microsoft Edge și Google Chrome, Speechify nu se limitează doar la citirea cu voce tare a textului digital, precum PDF-uri, articole de știri, Google Docs și emailuri. Cu ajutorul tehnologiilor avansate de OCR și AI, utilizatorii pot face rapid fotografii cu manuale, ghiduri de studiu, notițe scrise de mână și alte documente fizice și le pot converti în fișiere audio realiste, în timp real.
Cazuri de utilizare Speechify & misiunea ei
Permițând utilizatorilor să asculte textul în loc să îl citească sau în timp ce îl citesc, folosind funcția de evidențiere a textului din Speechify, aceștia pot asimila informațiile mai rapid, mai ușor și mai eficient. Acest lucru a transformat Speechify într-un instrument AI de neînlocuit pentru studenți și persoanele cu dificultăți sau dizabilități de învățare, precum dislexia, ADHD, vedere slabă, orbire, autism, contuzii și anxietate.
Totuși, deși Speechify a fost folosit inițial ca tehnologie asistivă pentru cei cu dificultăți de învățare, acum este folosit de tot felul de oameni, inclusiv, conform lui Weitzman, doctori, avocați, contabili, persoane din armată, directori, oameni din finanțe, cursanți de limbi străine și persoane multitasking care vor să își îmbunătățească productivitatea și viteza de citire, datorită vocilor sale naturale, de înaltă calitate, și tehnologiei OCR.
De fapt, Weitzman a împărtășit faptul că obiectivul Speechify este să se asigure că „cititul nu este niciodată o barieră în calea învățării pentru nimeni, indiferent de contextul din care provii.”
Vocile celebrităților
Pe măsură ce Speechify a crescut, a avut ocazia să colaboreze cu câteva celebrități de renume. În episod, Weitzman și Wilson au discutat despre cum Speechify a ajuns să colaboreze cu Snoop Dogg, care își împrumută propria voce pentru numeroasele opțiuni de voci din Speechify.
Weitzman a explicat că multe dintre parteneriatele Speechify apar atunci când oameni care folosesc produsul iau legătura cu ei. El povestește cum agentul lui Snoop Dogg a contactat Speechify, explicând că Snoop dorea să își folosească vocea pentru a-și ajuta publicul să consume informații. Acest lucru l-a dus pe Weitzman în studioul personal al lui Snoop Dogg pentru a-i înregistra și replica vocea cu ajutorul tehnologiilor de clonare vocală și sinteză vocală.
Dintre cele peste 200 de voci AI ale Speechify, disponibile în diverse limbi precum engleză, chineză, spaniolă, portugheză și altele, vocea actriței și investitoarei pe termen lung în Speechify, Gwyneth Paltrow, este de asemenea o opțiune de narator text-to-speech.
Însă, alături de aceste opțiuni de voci de celebrități care pot citi orice, de la postări pe rețele sociale la lucrări de cercetare, vin și măsuri de protecție pe care Speechify le implementează pentru a evita utilizarea abuzivă.
Siguranța AI & clonarea vocală
Deși Speechify recunoaște beneficiile instrumentelor AI text-to-speech și ale tehnologiei de clonare vocală, Weitzman a explicat că una dintre cele mai mari preocupări ale Speechify este protejarea creatorilor de conținut și a oamenilor, deoarece „siguranța AI este extrem de importantă.”
Implementarea politicilor de siguranță a devenit și mai importantă pe măsură ce Speechify și-a extins funcționalitățile text-to-speech pentru a lansa noi produse precum Speechify Studio, o suită de instrumente bazate pe AI ce le permite creatorilor de conținut să creeze voice-over-uri AI, voci personalizate, să traducă voice-over-uri, să își transcrie automat munca, să editeze videoclipuri și să utilizeze avataruri AI.
De exemplu, Weitzman explică faptul că Speechify le permite utilizatorilor să cloneze doar propria voce sau o voce care este fizic lângă ei, cum ar fi un prieten care și-a dat consimțământul, nu orice voce de pe internet, pentru a preveni abuzurile, furtul de identitate sau încălcarea drepturilor de autor.
„Filosofia noastră generală la Speechify îi pune pe deținătorii de drepturi în poziția de control”, a spus Weitzman. De asemenea, el a precizat că tehnologia AI a Speechify nu are ca scop înlocuirea creatorilor de conținut, precum actorii de voce de audiobook, ci să le „extindă [capacitatea] de a crea”, ajutându-i să producă mai mult conținut, într-un mod mai eficient.
În plus, Weitzman a dezvăluit că Speechify lucrează în prezent la un produs care va permite utilizatorilor să distingă cu ușurință dacă o voce este una umană sau generată artificial și, dacă este falsă, unde a fost creată inițial – o protecție ce va ajuta la prevenirea escrocheriilor prin voce în care persoane rău intenționate folosesc modificatoare de voce pentru a imita vocea unei persoane dragi în scopuri înșelătoare.
Ascultă-l pe Cliff Weitzman în podcastul Everyday AI
Pentru a afla mai multe despre modul în care AI-ul text-to-speech al Speechify modelează viitorul învățării și al creării de conținut, ascultă acest episod special al podcastului Everyday AI pe principalele platforme de podcast, precum Apple Podcasts și Spotify, sau ascultă mai jos:
Cronologia podcastului:
[00:12:50] Siguranța în domeniul text-to-voice
[00:18:12] Cazuri de utilizare ale tehnologiei text-to-speech
[00:21:05] Întrebări din public
[00:24:10] Viitorul tehnologiei text-to-speech
[00:27:28] Devine cuvântul scris mai puțin impactant?
[00:31:30] Utilizarea tehnologiei text-to-speech la nivel profesional

