Suara AI Sekarang Tidak Bisa Dibedakan dengan Suara Manusia Asli
- Jika penjahat menggunakan AI untuk mengkloning suara Anda, akan jauh lebih mudah untuk melewati protokol autentikasi suara di bank atau mengelabui orang yang Anda cintai agar mentransfer uang.

Amirudin Zuhri
Author


JAKARTA, TRENASIA.ID- Sebagian besar dari kita mungkin pernah mendengar suara kecerdasan buatan atau artificial intelligence (AI) melalui asisten pribadi seperti Siri atau Alexa. Intonasi datar dan penyampaian mekanisnya memberi kesan bahwa kita dapat dengan mudah membedakan suara yang dihasilkan AI dan suara manusia sungguhan.
Namun, para ilmuwan kini mengatakan bahwa rata-rata pendengar tidak lagi dapat membedakan suara manusia sungguhan dan suara "deepfake".
Dalam studi baru yang diterbitkan tanggal 24 September di jurnal PLoS One para peneliti menunjukkan bahwa ketika orang mendengarkan suara manusia, bersamaan dengan versi suara yang dihasilkan AI, mereka tidak dapat secara akurat mengidentifikasi mana yang nyata dan mana yang palsu.
"Suara-suara yang dihasilkan AI kini ada di sekitar kita. Kita semua pernah berbicara dengan Alexa atau Siri, atau panggilan kita dijawab oleh sistem layanan pelanggan otomatis," ujar penulis utama studi tersebut, Nadine Lavan , dosen senior psikologi di Queen Mary University of London, dalam sebuah pernyataan.
"Suara-suara itu memang tidak terdengar seperti suara manusia sungguhan, tetapi hanya masalah waktu sebelum teknologi AI mulai menghasilkan ucapan yang terdengar natural dan seperti suara manusia."
Studi tersebut menunjukkan bahwa, meskipun suara generik yang dibuat dari awal tidak dianggap realistis, klon suara yang dilatih dengan suara orang sungguhan — audio deepfake — ditemukan sama dipercayainya dengan suara asli mereka.
Para ilmuwan memberikan sampel 80 suara berbeda (40 suara buatan AI dan 40 suara manusia asli) kepada peserta studi dan meminta mereka untuk menandai suara mana yang mereka anggap asli dan suara buatan AI. Rata-rata, hanya 41% suara AI buatan awal yang salah diklasifikasikan sebagai suara manusia, yang menunjukkan bahwa dalam kebanyakan kasus, masih mungkin untuk membedakannya dari suara manusia asli.
Namun, untuk suara AI yang dikloning dari manusia, mayoritas (58%) salah diklasifikasikan sebagai suara manusia. Hanya sedikit lebih banyak (62%) suara manusia yang diklasifikasikan dengan benar sebagai suara manusia, sehingga para peneliti menyimpulkan bahwa tidak ada perbedaan statistik dalam kemampuan kita untuk membedakan suara orang sungguhan dari klon deepfake mereka.
“Hasilnya berpotensi memiliki implikasi mendalam bagi etika, hak cipta, dan keamanan, “ kata Lavan dikutip Live Science Senin 6 Oktober 2025.
Potensi Kejahatan
Jika penjahat menggunakan AI untuk mengkloning suara Anda, akan jauh lebih mudah untuk melewati protokol autentikasi suara di bank atau mengelabui orang yang Anda cintai agar mentransfer uang.
Kita telah menyaksikan beberapa insiden. Pada 9 Juli, misalnya, Sharon Brightwell ditipu sebesar us$15.000 . Brightwell mendengarkan seseorang yang ia pikir adalah putrinya yang menangis di telepon, mengatakan bahwa ia mengalami kecelakaan dan membutuhkan uang untuk perwakilan hukum agar putrinya tidak dipenjara. "Tidak ada yang bisa meyakinkan saya bahwa itu bukan dia," kata Brightwell tentang rekayasa AI realistis saat itu.
Suara AI yang tampak nyata juga dapat digunakan untuk memalsukan pernyataan dan wawancara politisi atau selebritas. Audio palsu dapat digunakan untuk mendiskreditkan individu atau memicu kerusuhan, yang dapat memicu perpecahan dan konflik sosial. Para penipu baru-baru ini membuat tiruan AI dari suara Perdana Menteri Queensland, Steven Miles , menggunakan profilnya untuk mencoba menarik orang berinvestasi dalam penipuan Bitcoin, misalnya.
Para peneliti menekankan bahwa klon suara yang mereka gunakan dalam penelitian ini bahkan tidak terlalu canggih. Mereka membuatnya dengan perangkat lunak komersial dan melatihnya hanya dengan rekaman suara manusia selama empat menit.
"Prosesnya hanya membutuhkan keahlian minimal, rekaman suara hanya beberapa menit, dan hampir tanpa biaya," ujar Navan dalam pernyataannya. "Ini menunjukkan betapa mudah diakses dan canggihnya teknologi suara AI."
Meskipun deepfake menghadirkan banyak peluang bagi pelaku kejahatan, tidak semuanya buruk. Mungkin ada lebih banyak peluang positif yang datang dengan kemampuan untuk menghasilkan suara AI dalam skala besar. "Mungkin ada aplikasi untuk meningkatkan aksesibilitas, edukasi, dan komunikasi, di mana suara sintetis berkualitas tinggi yang dirancang khusus dapat meningkatkan pengalaman pengguna," ujar Navan.

Amirudin Zuhri
Editor
