Semua Tentang Suara Deepfake
Meningkatnya media deepfake jadi topik terpanas di dunia keamanan siber dan media. Teknologi ini punya banyak kegunaan, mulai dari konten dewasa, berita palsu, sampai penipuan finansial. Menggunakan wajah dan suara orang lain tanpa izin dalam klip video dan audio yang meyakinkan memang terlihat seperti terobosan AI. Tapi hal ini penuh kontroversi.
Apa itu suara deepfake?
Suara deepfake adalah suara yang sangat mirip dengan suara asli seseorang. Walau sintetis, suara ini terdengar manusiawi dan bisa meniru nada, aksen, irama, serta ciri khas unik lainnya dengan akurat.
Orang yang membuat suara deepfake atau voice cloning memakai teknologi AI dan komputer canggih. Kadang bisa butuh waktu berminggu-minggu untuk meniru suara seseorang. Selain alat khusus, deepfake juga butuh data pelatihan, artinya harus punya rekaman suara target yang cukup.
Proses ini mirip menggunakan text to speech untuk menghasilkan suara sintetis. Namun, perangkat lunak TTS biasanya menghasilkan suara alami tanpa meniru suara orang tertentu.
Secara umum, tidak masalah jika orang meniru suara sendiri untuk buku audio, voiceover, dan konten lain. Namun, membuat suara deepfake orang lain tanpa izin adalah masalah serius.
Risiko Suara Deepfake
Dulu, otentikasi suara hanya ada di film fiksi ilmiah. Kini, teknologi itu sudah nyata meski belum sempurna. Seiring perkembangan software suara deepfake dan neural network, penipu bisa berbuat jauh lebih merusak.
Pada 2020, seorang manajer bank menerima telepon dari orang yang ia kira direktur perusahaan. Manajer mengenali suara itu dan langsung menyetujui transfer $35 juta. Ia tidak tahu suara itu hasil kloning.
Forbes pernah melaporkan kejadian serupa setahun sebelumnya. Terjadi di perusahaan energi Inggris yang ditipu lewat suara deepfake seseorang yang dipercaya.
Yang lebih mengkhawatirkan, merekam suara orang kini sangat mudah. Bisa lewat perekam, wawancara online, konferensi pers, dan sebagainya. Teknologi perekaman suara juga makin canggih. Data yang dimasukkan ke model AI jadi lebih akurat dan menghasilkan suara deepfake yang makin meyakinkan.
Alat keamanan siber belum menemukan cara pasti untuk mendeteksi deepfake audio.
Software Suara Deepfake Terbaik
Speechify
Berbeda dari alat lain di daftar ini, Speechify Voice Over bukan aplikasi kloning suara. Namun, text to speech ini memakai AI berkualitas tinggi untuk membuat media sintetis dan suara alami. Speechify Voice Over Studio punya banyak koleksi suara manusiawi dan bisa menciptakan suara baru dari berbagai parameter.
Konversi teks ke suara membantu orang membaca sambil mendengarkan, membuat podcast, bahkan rekaman audio dari teks yang dimasukkan atau dipindai. Bisa dipakai untuk pemasaran, pesan keluar, balasan layanan pelanggan, dan lain-lain.
Resemble
Resemble AI adalah salah satu software audio terkuat untuk membuat rekaman deepfake. Aplikasi kloningnya tidak butuh banyak data sebelum mulai meniru suara.
Anda bisa pakai Resemble untuk meniru suara sendiri. Ini efisien untuk klip komersial pra-rekam atau naskah podcast, iklan, dan sebagainya. Software sintesis bicara ini juga mendukung berbagai bahasa serta alat modifikasi suara, termasuk menambah intonasi dan emosi.
Descript
Descript adalah alat kloning suara dengan fitur editing canggih. Bisa memakai transkrip dan audio untuk menghasilkan suara realistis untuk video deepfake yang meyakinkan.
Walaupun butuh belajar lebih dalam, fitur kustomisasi, perekam layar, dan pengeditan multi-track akan membantu Anda membuat pidato ultra-realistis dengan suara siapa pun.
ReSpeecher
Menggunakan algoritma machine learning untuk menciptakan suara AI mirip manusia bisa sangat menarik dan menguntungkan. ReSpeecher dipakai Lucasfilm untuk suara Luke Skywalker di The Mandalorian.
Ini membuktikan sebagian software suara deepfake bisa melakukan lebih dari sekadar klip pendek di media sosial. ReSpeecher sangat dicari karena kualitas suara sintetisnya dan terbukti mampu meniru suara manusia.
Real-Time Voice Cloning
Tak semua orang punya ratusan dolar tiap bulan untuk ReSpeecher atau mau menunggu antrean. Ada yang butuh opsi murah bahkan gratis. Real-Time Voice Cloning adalah perangkat lunak open-source yang bisa diakses siapa saja di GitHub.
Ini bukan software sintesis ucapan yang paling mudah digunakan, terutama untuk suara orang lain, tapi bisa bekerja dengan klip audio kecil. Dalam beberapa kasus, sampel suara ini bisa menipu Alexa atau dipakai untuk lelucon via telepon.
iSpeech
iSpeech adalah generator suara gratis yang fokus pada kloning suara. Memiliki software pengenalan suara canggih dan pembaca text-to-speech juga. Aplikasinya punya banyak fungsi serta koleksi suara selebritas.
Anda dapat memakai iSpeech untuk membuat deepfake suara kustom, template unik, dan merekam suara sendiri. Alat ini serbaguna, meski tak semeyakinkan daftar lainnya. Namun cukup pas sebagai pengenalan ke dunia deepfake.
Speechify – Ciptakan Suara Manusia yang Alami
Speechify memanfaatkan algoritme deep learning untuk menghasilkan suara manusia yang alami tanpa meniru suara spesifik seseorang. Meski deepfake membawa banyak risiko keamanan, software text-to-speech umumnya lebih bermanfaat daripada membahayakan.
Coba Speechify Voice Over Studio untuk membuat podcast, narasi, membaca konten rumit, belajar bahasa baru, dan banyak lagi.
FAQ
Apakah FakeYou gratis?
FakeYou adalah generator suara AI terbatas tapi gratis. Punya banyak suara mirip selebritas, siapa pun bisa memakainya jika tak masalah dengan waktu konversi yang cenderung lambat. Mudah digunakan di browser.
Bagaimana mendeteksi suara deepfake?
Deteksi suara deepfake butuh software dan hardware canggih untuk menganalisis pola bicara, noise latar, dan elemen lainnya.
Apa bedanya suara deepfake dan voice synthesizer?
Suara deepfake sering berarti suara hasil kloning, sedangkan voice synthesizer menghasilkan suara seperti manusia untuk keperluan komersial.

