Speechify kurucusu, Everyday AI podcast'inde yapay zekanın geleceğini tartışıyor
Ünlü sesler üretici yapay zekanın geleceği mi? Yapay zeka güvenli mi? Speechify'ın kurucusu ve CEO'su Cliff Weitzman, Everyday AI Podcast'in 152. bölümünde Jordan Wilson ile bir araya gelerek bu ve daha pek çok soruya yanıt verdi.
Everyday AI podcast
Everyday AI podcast, sıradan insanların yapay zekâ ile kariyerlerini geliştirmelerine yardımcı olan, popüler ve ücretsiz bir günlük canlı yayın, podcast ve haber bültenidir. Podcast, dinleyenleri hızla büyüyen üretici yapay zekâ alanındaki en yeni ipuçları ve trendlerle güncel tutmanın yanı sıra, başarıya ulaşmak için yapay zekadan nasıl yararlanabileceklerini de öğretir. Nisan 2023'teki lansmanından bu yana Everyday AI podcast 22.000 dinleyiciye ve 7.800 günlük e-posta haber bülteni abonesine ulaştı; bu kişiler yapay zeka ile daha akıllı, değil daha fazla çalışmak ve yapay zekanın yardımıyla başarılarını yeni seviyelere taşımak için stratejiler öğrenmek istiyor.
Speechify hikayesi
Cliff Weitzman, kolejde disleksiyle mücadele ederken ve çoğu ders kitabının sesli kitap versiyonunun olmadığını fark ettikten sonra Speechify'ı geliştirdi. Bugün Speechify, dünyanın en iyi metinden sese uygulamalarından biri olup, 150.000'den fazla beş yıldızlı yoruma ve 25 milyonun üzerinde kullanıcıya sahip. Peki, nasıl oldu da Snoop Dogg bile şirketle ortaklık yapmak istedi? Weitzman, Everyday AI podcast'inin 27 Kasım Pazartesi günü yayınlanan 152. bölümünde bunları ve daha fazlasını anlattı.
Speechify nasıl çalışır?
Weitzman, Speechify'ın herhangi bir metni anında ve uygun maliyetle sese dönüştürmek için dünyadaki en kaliteli yapay zeka ses oluşturucuya ve en iyi metinden sese (TTS) motoruna dayandığını açıkladı. Android, Mac ve iOS uygulamaları, web sitesi versiyonu ile Microsoft Edge ve Google Chrome uzantıları sayesinde Speechify, yalnızca dijital metinleri (PDF, haber makaleleri, Google Dokümanlar, e-postalar vb.) sesli okumakla sınırlı değildir. Gelişmiş OCR ve yapay zeka teknolojisi sayesinde kullanıcılar, ders kitaplarının, çalışma rehberlerinin, elle yazılmış notların ve diğer fiziki belgelerin fotoğraflarını çekerek bunları gerçek zamanlı olarak doğal sese dönüştürebilir.
Speechify’ın kullanım alanları & hedefi
Speechify'ın metin vurgulama özelliği sayesinde kullanıcılar metni okuyarak ya da dinleyerek bilgiyi daha hızlı, kolay ve verimli şekilde edinebiliyor. Bu da Speechify’ı; öğrencilerin yanı sıra disleksi, DEHB, düşük görme, körlük, otizm, beyin sarsıntısı ve anksiyete gibi öğrenme farklılıkları veya engelleri yaşayan bireyler için vazgeçilmez bir yapay zeka aracı haline getirdi.
Ancak Speechify, ilk yıllarında ağırlıklı olarak öğrenme farklılıkları olan kişiler için yardımcı bir teknoloji olarak kullanılsa da, Weitzman’ın anlattığına göre artık doktorlar, avukatlar, muhasebeciler, askerler, yöneticiler, finans profesyonelleri, dil öğrenenler ve verimliliğini ve okuma hızını artırmak isteyen çoklu görev ustaları dahil her kesimden insan tarafından, doğal sesli yüksek kaliteli sesleri ve OCR teknolojisi sayesinde kullanılmaktadır.
Weitzman, Speechify'ın amacının aslında "kökeniniz ne olursa olsun, okumanın hiç kimse için öğrenmeye engel olmamasını sağlamak" olduğunu paylaştı.
Ünlü sesler
Speechify büyüdükçe, bazı büyük isimlerle iş birliği yapma fırsatı yakaladı. Bölümde Weitzman ve Wilson, Speechify'ın Snoop Dogg ile ortaklık kurma hikayesini ve Snoop Dogg'un kendi sesini Speechify'ın sunduğu çok sayıdaki ses seçeneğine nasıl kazandırdığını konuştular.
Weitzman, Speechify ortaklıklarının çoğunun, ürünü bizzat kullanan kişilerin kendilerinin temasa geçmesiyle hayata geçtiğini açıkladı. Snoop Dogg'un menajerinin Speechify'a ulaşıp, Snoop'un kendi sesini kullanarak kitlesinin bilgiye daha kolay erişmesine yardımcı olmak istediğini anlatmasını örnek gösterdi. Bu da Weitzman'ın Snoop Dogg'un stüdyosuna gitmesine ve sesinin ses klonlama ve konuşma sentezi teknolojisi ile kaydedilip çoğaltılmasına yol açtı.
Speechify’ın İngilizce, Çince, İspanyolca, Portekizce ve daha birçok dili kapsayan 200’den fazla yapay zeka sesi arasında, oyuncu ve uzun süreli Speechify yatırımcısı Gwyneth Paltrow'un sesi de metinden sese anlatıcı seçenekleri arasında yer alıyor.
Ancak sosyal medya gönderilerinden araştırma makalelerine kadar her şeyi okuyabilen bu ünlü ses seçenekleriyle birlikte Speechify, kötüye kullanımı önlemek için çeşitli güvenlik önlemleri de uygulamaktadır.
Yapay zeka güvenliği & ses klonlama
Speechify, yapay zekayla metinden sese araçlarının ve ses klonlama teknolojisinin faydalarının farkında olsa da Weitzman, Speechify'ın en büyük önceliklerinden birinin içerik üreticileri ve insanları korumak olduğunu ve "yapay zeka güvenliğinin son derece önemli" olduğunu vurguladı.
Speechify, metinden sese işlevini Speechify Studio gibi yeni ürünleri piyasaya sürerek genişlettikçe, güvenlik politikalarının uygulanması daha da hayati hale geldi. Speechify Studio, içerik üreticilerine yapay zeka destekli seslendirmeler, özel sesler oluşturma, seslendirmeleri çevirme, çalışmalarını otomatik olarak transkribe etme, videoları düzenleme ve yapay zeka avatarlarını kullanma imkanı sağlayan bir araç paketidir.
Örneğin Weitzman, Speechify'ın yalnızca kullanıcının kendi sesini veya yanında bulunan birinin (örneğin izin veren bir arkadaşının) sesini klonlamasına izin verdiğini, internette rastgele bulduğu herhangi bir sesin klonlanmasına izin vermediğini belirtti. Bu da kötüye kullanım ile kimlik veya telif hakkı ihlallerine karşı koruma sağlar.
“Speechify’daki genel felsefemiz, hak sahiplerini direksiyonun başına oturtmaktır,” dedi Weitzman. Ayrıca Speechify'un yapay zeka teknolojisinin, sesli kitap anlatıcıları gibi içerik üreticilerinin yerini almak için değil, “onların içerik üretme kapasitesini artırmak” (daha hızlı ve verimli içerik üretmelerine yardımcı olmak gibi) için geliştirildiğini belirtti.
Weitzman ayrıca, Speechify’ın şu anda kullanıcıların bir sesin insan mı yoksa bir yapay zeka ürünü mü olduğunu kolayca anlayabileceği ve eğer yapay zekaysa tam olarak nerede oluşturulduğunu gösterecek bir ürün üzerinde çalıştığını açıkladı. Bu koruma, kötü niyetli kişilerin bir ses değiştirici kullanarak yakınlarının sesini taklit ettiği dolandırıcılıklara karşı vatandaşları koruyacak.
Cliff Weitzman'ı Everyday AI podcast'inde dinleyin
Speechify’ın metinden sese AI’inin öğrenmenin ve içerik üretiminin geleceğini nasıl şekillendirdiği hakkında daha fazla bilgi edinmek için, Everyday AI podcast’inin bu özel bölümünü başlıca podcast platformlarında (Apple Podcast ve Spotify gibi) ya da aşağıdan dinleyebilirsiniz:
Podcast zaman damgaları:
[00:12:50] Metinden sese alanında güvenlik
[00:18:12] Metinden sese için kullanım alanları
[00:21:05] İzleyici soruları
[00:24:10] Metinden sese teknolojisinin geleceği
[00:27:28] Yazılı kelimenin etkisi azalıyor mu?
[00:31:30] Profesyoneller için metinden sese kullanımı

