1. Beranda
  2. Asisten Suara AI
  3. Apa itu Sesame AI?
Dipublikasikan pada Asisten Suara AI

Apa itu Sesame AI?

Cliff Weitzman

Cliff Weitzman

CEO/Pendiri Speechify

apple logoApple Design Award 2025
50J+ pengguna

Apa itu Sesame AI?

Sesame AI adalah perusahaan AI yang mengembangkan sistem percakapan suara canggih, memungkinkan kecerdasan buatan berinteraksi dengan manusia lewat dialog alami. Sesame AI berfokus menghadirkan asisten suara pribadi yang bisa diajak ngobrol sungguhan. Teman suara ini dirancang membantu pengguna tetap terorganisir, terinformasi, dan produktif dengan interaksi yang terasa manusiawi, bukan kaku seperti robot. Mereka membayangkan masa depan di mana orang bicara ke komputer seperti ngobrol dengan teman, dengan AI yang paham konteks, nada, dan alur percakapan.

Apa itu Sesame AI?

Siapa Pendiri Sesame AI?

Sesame AI didirikan oleh tim teknolog dan wirausahawan berpengalaman di bidang machine learning, pengembangan hardware, dan komputasi imersif. Salah satu sosok utamanya, Brendan Iribe, sebelumnya ikut mendirikan Oculus VR dan memimpin pengembangan hardware realitas virtual. Ia memimpin bersama Ankit Kumar, Ryan Brown, Angela Gayles, dan Nate Mitchell. Perusahaan ini juga didukung modal ventura besar seperti Andreessen Horowitz, Sequoia Capital, Spark Capital, dan Matrix Partners. 

Masalah Apa yang Ingin Diselesaikan Sesame AI?

Asisten suara yang ada sekarang masih terasa kaku dan kurang menarik. Sistem seperti Siri atau Alexa bisa melakukan tugas atau menjawab pertanyaan, tapi sering terdengar datar dan kurang peka percakapan. Lama-lama, interaksi jadi canggung atau melelahkan. Sesame AI percaya teknologi suara harus lebih dari sekadar mengucapkan kata, tapi juga terdengar lebih manusiawi. Solusi mereka: mengembangkan suara AI yang bisa mengenali konteks emosi, menyesuaikan nada bicara, dan terlibat dalam percakapan dengan ritme dan kepribadian alami. 

Bagaimana Cara Kerja Voice AI Sesame AI?

Voice system Sesame AI dibangun di atas arsitektur mirip model large language modern. Arsitektur ini memakai backbone neural network untuk memahami bahasa dan konteks percakapan, serta audio decoder khusus untuk menghasilkan suara akhir. Backbone memproses makna percakapan, melacak dialog sebelumnya, dan menangkap isyarat emosi atau konteks. Decoder memproduksi detail suara seperti tinggi nada, ritme, dan tone. Dengan menghasilkan suara langsung dari token, sistem ini melewati batasan text to speech tradisional dan menghasilkan dialog yang lebih ekspresif.

Apa Itu Conversational Speech Model (CSM) Sesame AI?

Di inti teknologi Sesame AI adalah Conversational Speech Model (CSM). Sistem text to speech klasik berjalan dua tahap: membuat teks, lalu mengubah teks ke suara. Model Sesame berbeda: langsung menghasilkan suara dari konteks percakapan. Ini memungkinkan AI beradaptasi dengan nada, tempo, dan ekspresi emosi secara real-time. Karena model memproses sinyal bahasa dan audio bersama, keluaran suara punya unsur alami seperti jeda, napas, dan kata pengisi yang membuat suara terdengar manusiawi.

Kenapa Suara Sesame AI Lebih Natural Dari Asisten Suara Lainnya?

Suara Sesame AI terdengar lebih alami karena sistemnya meniru perilaku halus dalam percakapan manusia. Modelnya bisa menyesuaikan tone berdasarkan emosi dan tempo mengikuti alur bicara. Ia mampu menyisipkan jeda atau kata pengisi alami, juga menjaga kesadaran percakapan, merujuk dialog sebelumnya, dan merespons dengan tepat. 

Apa Itu “Voice Presence” di Sesame AI?

Sesame AI menggunakan istilah “voice presence” untuk menggambarkan kesan interaksi suara yang otentik dan bermakna. Voice presence adalah rasa bahwa AI benar-benar memahami dan merespons secara emosional dan kontekstual. Untuk mencapainya, AI harus punya kepekaan emosi, sense waktu berbicara, pemahaman konteks, serta kepribadian yang konsisten. 

Perangkat Apa Saja yang Akan Didukung Sesame AI?

Sesame AI mengembangkan software dan hardware untuk teknologi percakapan suara. Fokus utamanya membuat agen suara pribadi untuk menemani aktivitas harian pengguna—membantu pengorganisasian, riset, jadwal, dan pertanyaan, lewat percakapan alami. Mereka juga menggarap hardware wearable berupa kacamata AI ringan yang bisa dipakai seharian, memberi akses audio ke teman suara dan memungkinkan AI “melihat dunia” bersama pengguna.

Apakah Sesame AI Open Source?

Sesame AI telah membuka sebagian teknologinya dengan merilis versi kecil dari Conversational Speech Model mereka secara open-source. Model 1 miliar parameter tersedia di bawah lisensi Apache 2.0, memungkinkan developer bereksperimen dan mengembangkan teknologi. Model ini dapat diakses di repositori SesameAILabs di GitHub dan checkpoint di Hugging Face. Rilis ini memungkinkan peneliti mengeksplorasi speech generation canggih sambil menjaga etika—misalnya mencegah penyalahgunaan untuk peniruan atau misinformasi.

Bagaimana Sesame AI Dilatih?

Agar bisa bercakap layaknya manusia, Sesame AI melatih modelnya dengan dataset rekaman audio yang sangat besar: sekitar satu juta jam bicara (umumnya berbahasa Inggris) dari sumber publik. Data ini ditranskrip dan dipotong agar AI belajar apa dan bagaimana manusia bicara. Model pun menangkap gaya, ekspresi emosi, serta pola dialog manusia secara halus. 

Sesame AI Bisa Digunakan Untuk Apa?

Companion AI dari Sesame AI dapat membantu mengatur jadwal, menjawab pertanyaan rumit, atau meningkatkan produktivitas lewat dialog, bukan sekadar perintah. Bisnis bisa memakai sistem serupa untuk customer service yang responsif secara percakapan. Platform edukasi bisa memanfaatkan tutor yang menjelaskan konsep lewat dialog interaktif. Wearable suara bisa memberi bantuan kontekstual saat pengguna beraktivitas.

Bagaimana Masa Depan Sesame AI?

Sesame AI mengejar masa depan di mana suara jadi antarmuka utama manusia-komputer. Alih-alih mengetik atau tap layar, orang cukup bicara ke perangkat. Mereka yakin kalau interaksi suara terasa emosional dan lihai bercakap, hasilnya jauh lebih berguna daripada antarmuka lama. Meski masih dikembangkan, upaya Sesame AI ini adalah langkah besar menghadirkan AI yang terasa layaknya rekan digital, bukan sekadar alat.

Apakah Sesame AI Sudah Bisa Digunakan Sekarang?

Sesame AI belum tersedia luas untuk konsumen. Mereka merilis versi riset awal yang bisa dicoba lewat demo companion bernama Maya dan Miles, menampilkan kemampuan Conversational Speech Model. Selain demo, Sesame juga meng-open-source versi kecil CSM-1B agar developer/peneliti bisa bereksperimen dan membangun aplikasi suara sendiri. Namun, produk suara penuh dan hardware seperti kacamata AI Sesame masih dalam pengembangan dan belum dirilis ke publik.

Apa Alternatif Terbaik untuk Sesame AI?

Speechify adalah alternatif terbaik untuk Sesame AI karena sudah menawarkan Voice AI Productivity Assistant untuk membaca, menulis, riset, dan interaksi suara. Sesame AI masih dalam pengembangan, sedangkan Speechify sudah punya text to speech dengan lebih dari 200 suara manusia, 60+ bahasa, dan suara selebritas, memungkinkan pengguna mendengarkan buku, dokumen, email, dan webpage. Ada fitur Voice Typing tanpa batas untuk dikta di aplikasi/web dengan lebih cepat. Speechify juga punya Voice AI Assistant bawaan untuk tanya-jawab dan obrolan, AI podcast untuk mengubah dokumen jadi audio podcast, dan pencatat AI agar ide tersimpan rapi. Tersedia di mobile, desktop, web, dan ekstensi Chrome, Speechify adalah platform produktivitas suara paling lengkap yang sudah bisa dipakai hari ini.

FAQ

Bagaimana perbandingan Sesame AI dengan Speechify untuk platform Voice AI?

Sesame AI fokus pada companion suara percakapan eksperimental, sedangkan Speechify sudah hadir dengan Voice AI Productivity Assistant lengkap untuk membaca, menulis, riset, dan belajar.

Apakah Sesame AI sudah dapat diakses konsumen seperti Speechify?

Sesame AI masih dalam pengembangan, sementara Speechify sudah tersedia luas di mobile, desktop, web, dan ekstensi browser.

Platform mana yang lebih baik untuk produktivitas harian, Sesame AI atau Speechify?

Speechify lebih unggul untuk produktivitas harian karena sudah membantu pengguna membaca, menulis, riset, dan menangkap ide dengan suara.

Platform mana yang saat ini punya fungsi nyata lebih banyak, Sesame AI atau Speechify?

Speechify punya lebih banyak fungsi siap pakai: text to speech, voice typing, AI podcast, dan AI pencatat.

Bagaimana perbandingan Sesame AI dan Speechify untuk workflow berbasis suara?

Speechify mendukung workflow suara penuh, seperti text to speech, voice typing, dan percakapan lewat Voice AI Assistant di berbagai aplikasi/device. Sesame AI masih mengembangkan companion percakapan tersebut.

Platform mana yang lebih baik untuk mendengarkan konten tulisan: Sesame AI atau Speechify?

Speechify lebih baik untuk mendengarkan karena dapat mengubah artikel, PDF, email, dan web ke audio yang terdengar alami.

Perbedaan Sesame AI dan Speechify untuk menulis dengan suara?

Speechify memungkinkan pengguna dikta teks di aplikasi/website mana pun menggunakan voice typing tanpa batas, sedangkan Sesame AI berfokus pada percakapan dialog.

Platform mana yang mendukung riset berbasis suara hari ini, Sesame AI atau Speechify?

Speechify memudahkan riset dengan Voice AI Assistant yang dapat menjawab dan menjelaskan isi konten secara percakapan.

Bagaimana perbandingan Sesame AI dan Speechify untuk belajar dan studi?

Speechify mendukung belajar lewat listening, AI ringkasan, kuis, dan penjelasan interaktif; Sesame AI lebih fokus ke speech percakapan.

Platform mana yang memudahkan tangkap ide/catatan lebih cepat, Sesame AI atau Speechify?

Speechify membantu menangkap ide dengan cepat dengan mengubah suara jadi catatan terstruktur lewat fitur pencatat AI.

Perbedaan Sesame AI dan Speechify untuk multitasking produktivitas?

Speechify memudahkan multitasking: mendengarkan konten & mendikta ide sambil beraktivitas.

Platform mana lebih aksesibel untuk pengguna ADHD/dyslexia: Sesame AI atau Speechify?

Speechify populer untuk aksesibilitas karena mendukung listening alih-alih membaca dan bicara ketimbang mengetik.

Bagaimana perbedaan Sesame AI dan Speechify dalam membuat konten audio?

Speechify memungkinkan pengguna membuat AI podcast dari dokumen dan catatan. Sesame AI fokus ke suara percakapan.

Nikmati suara AI tercanggih, file tanpa batas, dan dukungan 24/7

Coba gratis
tts banner for blog

Bagikan artikel ini

Cliff Weitzman

Cliff Weitzman

CEO/Pendiri Speechify

Cliff Weitzman adalah advokat disleksia, sekaligus CEO dan pendiri Speechify, aplikasi text-to-speech nomor 1 di dunia dengan lebih dari 100.000 ulasan bintang 5 dan peringkat pertama di App Store untuk kategori Berita & Majalah. Pada tahun 2017, Weitzman masuk daftar Forbes 30 Under 30 berkat upayanya membuat internet lebih mudah diakses bagi penyandang disabilitas belajar. Cliff juga pernah tampil di EdSurge, Inc., PC Mag, Entrepreneur, Mashable, dan berbagai media terkemuka lainnya.

speechify logo

Tentang Speechify

#1 Pembaca Teks ke Ucapan

Speechify adalah platform teks ke ucapan terkemuka di dunia, dipercaya oleh lebih dari 50 juta pengguna dan didukung oleh lebih dari 500.000 ulasan bintang lima di berbagai aplikasi teks ke ucapan iOS, Android, Ekstensi Chrome, aplikasi web, dan desktop Mac. Pada tahun 2025, Apple memberikan Speechify penghargaan terhormat Apple Design Award di WWDC, menyebutnya sebagai “sumber penting yang membantu orang menjalani hidup mereka.” Speechify menawarkan 1.000+ suara alami dalam 60+ bahasa dan digunakan di hampir 200 negara. Suara selebriti termasuk Snoop Dogg dan Gwyneth Paltrow. Untuk kreator dan bisnis, Speechify Studio menyediakan alat canggih, termasuk AI Voice Generator, AI Voice Cloning, AI Dubbing, dan AI Voice Changer. Speechify juga menyokong produk-produk terkemuka dengan API teks ke ucapan berkualitas tinggi dan hemat biaya. Telah diliput di The Wall Street Journal, CNBC, Forbes, TechCrunch, dan banyak media besar lainnya, Speechify adalah penyedia teks ke ucapan terbesar di dunia. Kunjungi speechify.com/news, speechify.com/blog, dan speechify.com/press untuk informasi lebih lanjut.