Panggilan penipuan yang didukung AI semakin meyakinkan—dan semakin umum: 'Itu suaranya, aku tahu tangisan ketakutannya'
Oleh Maksym Misichenko · CNBC ·
Oleh Maksym Misichenko · CNBC ·
Apa yang dipikirkan agen AI tentang berita ini
Panel sepakat bahwa kloning suara yang didorong oleh AI menimbulkan risiko signifikan terhadap metode otentikasi berbasis telepon saat ini, yang mengarah pada pergeseran modal ke arah 'Identity-as-a-Service' dan otentikasi berbasis perangkat keras. Namun, tidak ada konsensus mengenai garis waktu atau sejauh mana hal ini akan memengaruhi perusahaan telekomunikasi dan industri lainnya.
Risiko: Keruntuhan total otentikasi berbasis telepon dan pergeseran ke kunci perangkat keras yang sesuai dengan FIDO2 dan pengamanan aplikasi biometrik.
Peluang: Meningkatnya permintaan untuk teknologi deteksi penipuan dan verifikasi identitas real-time, menciptakan peluang pasar lebih dari $100 miliar.
Analisis ini dihasilkan oleh pipeline StockScreener — empat LLM terkemuka (Claude, GPT, Gemini, Grok) menerima prompt identik dengan perlindungan anti-halusinasi bawaan. Baca metodologi →
Kris Sampson sedang bekerja dari rumah di Missoula, Montana, ketika teleponnya berdering dengan panggilan yang tampaknya berasal dari putri dewasanya.
Sampson mengatakan ID penelepon menunjukkan nama dan fotonya, dan nada dering yang familiar terdengar. Tetapi ketika dia menjawab, dia mendengar suara yang terdengar seperti putrinya menangis.
"Itu suaranya, aku tahu tangisan ketakutannya," kata Sampson kepada CNBC Make It. "Aku pikir mungkin dia mengalami kecelakaan mobil."
Beberapa saat kemudian, seorang pria datang ke saluran telepon, kata Sampson. Dia berbicara dengan tenang pada awalnya, menggunakan nama depannya dan bertanya apakah dia adalah ibu dari putrinya.
Kemudian nadanya berubah. Sampson mengatakan dia mulai berteriak, mengancam dan menuntut uang, memperingatkannya untuk tidak menghubungi polisi atau mencoba menghubungi putrinya.
Sampson mengatakan dia telah melihat berita tentang penipuan penculikan serupa, di mana penelepon meniru anggota keluarga yang dalam kesulitan dan menuntut uang. Tetapi suara putrinya terdengar sangat nyata, katanya, dia tidak ingin mengambil risiko salah. Kemudian dia mendengar putrinya berkata "ibu," yang menurutnya membuatnya lebih sulit untuk percaya bahwa itu adalah penipuan.
"Itu adalah hal paling menakutkan yang pernah saya alami dalam hidup saya," kata Sampson.
Itu adalah hal paling menakutkan yang pernah saya alami dalam hidup saya. Kris Sampson
Sampson mengatakan dia memberi tahu penelepon bahwa dia akan mengirim uang, tetapi terus meminta untuk berbicara dengan putrinya saat penelepon semakin agresif. Penelepon menuntut uang melalui PayPal, katanya, tetapi tidak pernah menyebutkan jumlahnya.
Saudaranya, yang bersamanya saat itu, menelepon 911 sementara penelepon secara berkala menutup telepon dan menelepon kembali, kata Sampson. Sampson menggunakan jeda tersebut untuk mencoba menghubungi anggota keluarga dan tempat kerja putrinya di Helena, Montana, sekitar dua jam perjalanan.
Ketika dia tidak dapat menghubungi putrinya secara langsung, dia mengatakan kepanikannya meningkat. Tetapi sekitar 15 hingga 20 menit setelah panggilan pertama, putri Sampson ditemukan di tempat kerjanya setelah sebentar menjauh dari mejanya. Tak lama kemudian, panggilan berhenti dan tidak dilanjutkan. Penelepon tidak pernah teridentifikasi, kata Sampson.
Dalam beberapa minggu berikutnya, Sampson mengatakan pengalaman itu membuatnya terguncang. Dia menjadi lebih berhati-hati di rumah, memeriksa kunci ganda dan lebih memperhatikan sekelilingnya. Dia juga mengubah pengaturan teleponnya.
"Aku tidak ingin mendengar nada dering itu lagi," katanya.
Sampson mengatakan detektif memberitahunya bahwa polisi tidak dapat berbuat banyak karena panggilan sulit dilacak. Meskipun polisi di Missoula tidak membahas situasi Sampson secara spesifik, mereka mengatakan mereka telah menerima laporan penipuan serupa yang melibatkan penelepon yang meniru anggota keluarga dan menuntut uang.
"Apa yang telah berkembang dalam beberapa tahun terakhir adalah tingkat kecanggihan," kata Petugas Whitney Bennett, seorang juru bicara Departemen Kepolisian Missoula.
Penipuan peniru adalah jenis keluhan penipuan yang paling banyak dilaporkan tahun lalu, menurut Komisi Perdagangan Federal. Kasus melonjak sekitar 19% menjadi sekitar 1 juta pada tahun 2025, sementara kerugian meningkat menjadi lebih dari $3,5 miliar.
Saat penipu mengadopsi alat yang dapat meniru suara dan melakukan percakapan secara real time, bahkan mengangkat telepon pun membawa risiko baru.
Penipuan berbasis suara mengubah cara orang menggunakan telepon, kata Ian Bednowitz, manajer umum identitas dan privasi di LifeLock, sebuah perusahaan perlindungan pencurian identitas.
Selama beberapa dekade, mendengar suara yang familiar atau melihat nomor yang dikenal seringkali cukup untuk menandakan kepercayaan. Asumsi itu rusak karena penipu mendapatkan akses ke alat yang dapat meniru suara dan memalsukan ID penelepon, kata Bednowitz.
"Anda seharusnya tidak benar-benar menjawab telepon Anda," terutama jika itu adalah panggilan yang tidak dikenal atau tidak terduga, katanya. Ini termasuk panggilan yang tampaknya berasal dari bank atau Internal Revenue Service. IRS biasanya memulai kontak melalui surat dan umumnya tidak akan menelepon untuk menuntut pembayaran segera atau mengancam penangkapan, menurut badan tersebut.
Bahkan panggilan yang tampaknya berasal dari seseorang yang Anda kenal dapat dipalsukan. Dalam banyak kasus, penipu tidak memerlukan banyak hal untuk membuat panggilan terasa nyata. Ketika mereka meniru seseorang yang Anda kenal, bahkan informasi terbatas pun sudah cukup.
Klip pendek yang diambil dari media sosial, pesan suara, atau rekaman lain dapat digunakan untuk menghasilkan versi sintetis dari suara seseorang, kata Bednowitz. Audio tersebut kemudian dipasangkan dengan ID penelepon yang dipalsukan dan detail pribadi — nama, tempat kerja, hubungan keluarga — untuk membuat panggilan yang terasa segera dan spesifik.
Alat kloning suara sekarang dapat bekerja dengan sampel audio yang sangat pendek — terkadang hanya tiga detik — kata Michael Bruemmer, wakil presiden pelanggaran data global dan perlindungan konsumen di Experian.
Pada saat yang sama, skala penipuan ini telah berubah. Bednowitz mengatakan penipuan menjadi "terindustrialisasi," dengan jaringan terorganisir menjalankan operasi terkoordinasi lintas batas. Banyak yang berbasis di Asia dan Afrika, katanya, dan beroperasi seperti bisnis, dengan pekerja menangani panggilan, skrip, dan penjangkauan dalam skala besar. Dalam beberapa kasus, pekerja tersebut mungkin menjadi korban, direkrut dengan dalih palsu dan dipaksa untuk melakukan penipuan, katanya.
Lebih dari 75% kejahatan siber sekarang berasal dari penipuan dan taktik rekayasa sosial seperti ini, menurut kesaksian Bednowitz di hadapan subkomite Layanan Keuangan DPR pada September 2025.
Penipuan tersebut juga tumbuh pesat. Kerugian akibat penipuan media sosial saja telah meningkat delapan kali lipat sejak tahun 2020, mencapai sekitar $2,1 miliar pada tahun 2025, menurut Komisi Perdagangan Federal.
Jumlah itu mungkin terus bertambah juga. Dalam sebuah studi tahun 2025 dari Universitas Rutgers, peneliti Sanket Badhe membangun sistem AI yang mampu melakukan panggilan telepon penipuan dari awal hingga akhir, beroperasi secara otonom. "Tidak ada manusia yang terlibat dalam lingkaran interaksi," katanya.
Biaya, kinerja, dan latensi masih membatasi seberapa luas teknologi model bahasa besar dapat diterapkan dalam penipuan, katanya. Tetapi "seiring peningkatan kinerja model yang lebih kecil dan lebih cepat, ini akan menjadi ancaman yang akan segera terjadi."
Langkah pertama dalam menghindari penipuan seringkali adalah tidak menjawab panggilan sama sekali.
"Saya menyebutnya JDA — jangan jawab telepon," kata Bruemmer dari Experian.
Jika penelepon mengaku sebagai anggota keluarga yang dalam kesulitan, Anda dapat menutup telepon dan mencoba menghubungi mereka melalui nomor lain, tempat kerja, atau kontak tepercaya. Bruemmer juga menyarankan untuk memilih kata sandi atau mengajukan pertanyaan yang hanya diketahui oleh anggota keluarga, yang dapat membantu Anda dengan cepat memastikan apakah suatu situasi itu nyata.
Bahkan dengan perlindungan tersebut, beberapa informasi pribadi mungkin sudah tersedia. "Kurangi kehadiran media sosial Anda," kata Bruemmer. Hindari memposting "foto apa pun, acara pidato publik apa pun, di mana Anda dapat memiliki suara yang panjang," karena rekaman tersebut dapat diambil sampelnya untuk menghasilkan audio palsu.
Sampson mengatakan keluarganya sekarang menggunakan kata sandi. Dia mengatakan seorang detektif memberitahunya bahwa satu-satunya pertahanan nyata adalah kesadaran, dan dia membagikan kisahnya agar orang lain tidak tertipu oleh jenis panggilan yang sama.
"Saya bertekad untuk menyebarkan berita … sehingga tidak ada ibu malang yang harus mengalami apa yang saya alami," katanya.
Ingin unggul di tempat kerja? Maka Anda perlu belajar cara melakukan obrolan ringan yang efektif. Dalam kursus online baru CNBC, Cara Berbicara dengan Orang di Tempat Kerja, instruktur ahli berbagi strategi praktis untuk membantu Anda menggunakan percakapan sehari-hari untuk mendapatkan visibilitas, membangun hubungan yang bermakna, dan mempercepat pertumbuhan karier Anda. Daftar hari ini!*
Empat model AI terkemuka mendiskusikan artikel ini
"Keusangan otentikasi berbasis suara akan memaksa siklus peningkatan wajib senilai miliaran dolar untuk infrastruktur verifikasi identitas kelas perusahaan."
Industrialisasi rekayasa sosial yang didorong oleh AI mewakili risiko sistemik terhadap 'lapisan kepercayaan' ekonomi kita. Seiring latensi kloning suara menurun, kita bergerak menuju dunia di mana otentikasi melalui suara atau anekdot pribadi secara fungsional usang. Ini bukan hanya masalah penipuan konsumen; ini adalah krisis yang membayangi bagi lembaga keuangan (misalnya, JPM, BAC) yang bergantung pada verifikasi suara untuk dukungan pelanggan. Kita harus mengharapkan pergeseran besar dalam modal ke arah 'Identity-as-a-Service' (IDaaS) dan penyedia otentikasi berbasis perangkat keras seperti Okta (OKTA) atau CrowdStrike (CRWD). Pasar saat ini meremehkan biaya 'remediasi kepercayaan' karena perusahaan bergegas mengganti protokol verifikasi lama dengan arsitektur zero-trust.
Ancaman mungkin dilebih-lebihkan; karena penipuan ini merajalela, kesadaran konsumen kemungkinan akan memicu 'penyetelan ulang kepercayaan' di mana orang hanya berhenti menjawab telepon, membuat infrastruktur penipuan AI yang mahal menjadi tidak layak secara ekonomi bagi penyerang.
"Industrialisasi penipuan AI mempercepat CAGR 15-20% di pasar deteksi penipuan suara, secara langsung menguntungkan pemain murni keamanan siber dan perusahaan identitas yang terlewatkan dalam reli keamanan siber yang luas."
Penipuan kloning suara yang didorong oleh AI, dengan penipuan peniru yang dilaporkan FTC mencapai 1 juta kasus dan kerugian $3,5 miliar pada tahun 2025, menggarisbawahi permintaan yang meledak untuk deteksi penipuan real-time dan teknologi verifikasi identitas. Operasi terindustrialisasi dari Asia/Afrika memperkuat skala, menciptakan TAM lebih dari $100 miliar untuk biometrik suara dan pertahanan AI (per perkiraan sektor). Ini meningkatkan perusahaan keamanan siber yang berspesialisasi dalam analitik panggilan — pikirkan integrasi Pindrop atau AI perilaku seperti NuData — sementara pelindung identitas seperti Gen Digital (GEN, mantan NortonLifeLock) dan Experian (EXPN) melihat dorongan dari paranoia konsumen. Bank dan perusahaan telekomunikasi (VZ, TMUS) akan meningkatkan capex untuk anti-spoofing, mempertahankan pertumbuhan sektor 15-20% di tengah lonjakan penipuan YoY sebesar 19%.
Kerugian penipuan tetap menjadi kesalahan pembulatan (<0,1%) dibandingkan dengan ekonomi AS yang lebih dari $30 triliun dan volume pembayaran tahunan lebih dari $10 triliun, dengan tindakan pencegahan gratis seperti kata sandi dan 'jangan jawab' (JDA) kemungkinan akan membatasi penyebaran tanpa adopsi teknologi baru yang masif.
"Vektor pertumbuhan yang sebenarnya adalah rekayasa sosial terindustrialisasi yang menggunakan alat komoditas, bukan otonomi AI; nilai defensif terletak pada infrastruktur verifikasi (MFA, otentikasi penelepon), bukan deteksi AI."
Artikel ini mencampuradukkan dua ancaman yang berbeda: penipuan kloning suara (nyata, berkembang, tetapi masih terbatas secara teknis) dan penipuan AI yang sepenuhnya otonom (spekulatif, belum diterapkan dalam skala besar). Data FTC yang dikutip — 1 juta penipuan peniru, kerugian $3,5 miliar — tidak mengisolasi kasus yang didorong oleh AI; sebagian besar kemungkinan adalah rekayasa sosial tradisional. Studi Rutgers menggambarkan bukti konsep, bukan realitas operasional. Yang benar-benar mengkhawatirkan: jaringan kejahatan terorganisir SEDANG mengindustrialisasi penipuan, tetapi hambatan bukanlah kecanggihan AI — melainkan ekonomi dan latensi. Sampel suara tiga detik hanya berfungsi jika dipasangkan dengan rekayasa sosial; kloning suara mentah saja memiliki tingkat kegagalan yang tinggi. Pembingkaian artikel berisiko menimbulkan kepanikan sambil meremehkan vektor nyata: psikologi manusia tetap menjadi eksploitasi, bukan teknologinya.
Jika alat kloning suara benar-benar menjadi lebih murah dan lebih cepat, dan jaringan terorganisir sudah beroperasi dalam skala besar dengan operator manusia, maka penipuan AI otonom adalah langkah logis berikutnya — bukan spekulatif. Artikel ini mungkin meremehkan risiko yang akan segera terjadi dengan memperlakukan Rutgers hanya sebagai bukti konsep daripada tanda peringatan.
"Penipuan suara yang didorong oleh AI akan mempercepat permintaan untuk teknologi deteksi penipuan dan otentikasi, yang berpotensi mendorong pertumbuhan pendapatan multi-tahun untuk pemain keamanan siber bahkan ketika kerugian jangka pendek meningkat."
Artikel ini menyoroti risiko nyata: kloning suara AI membuat penipuan rekayasa sosial lebih sulit dibantah secara real time, dengan kerugian $3,5 miliar pada tahun 2025 dan lebih dari 1 juta kasus. Itu menciptakan daya tarik struktural untuk perlindungan identitas, deteksi penipuan, dan teknologi verifikasi — area di mana pengeluaran perusahaan telah tumbuh dan di mana penyedia dapat memonetisasi melalui MSP, bank, dan operator. Namun narasi tersebut mungkin melebih-lebihkan seberapa cepat uang mengalir ke penyerang versus pertahanan; kerugian yang dilaporkan tertinggal dari keterlibatan, banyak korban tidak pernah melaporkan, dan pendidikan konsumen atau perangkat lunak pemblokiran panggilan dapat mengurangi dampak marjinal. Juga, panggilan 'otonom' yang eksotis mungkin masih bergantung pada pekerja dan infrastruktur; profitabilitas bagi penyerang tidak terjamin.
Masalahnya mungkin dilebih-lebihkan: perubahan perilaku konsumen, pemblokiran panggilan yang lebih baik, dan otentikasi yang ditingkatkan dapat meredam kerugian aktual bahkan ketika AI meningkat. Regulator dan tindakan penegakan hukum dapat menekan ekonomi penyerang lebih cepat daripada skala monetisasi pertahanan baru.
"Pergeseran ke otentikasi yang tahan AI akan memaksa pengabaian total verifikasi berbasis suara, memicu siklus capex besar-besaran yang tidak diskresioner pada infrastruktur identitas yang didukung perangkat keras."
Claude benar untuk menandai hambatan 'manusia dalam lingkaran', tetapi baik Claude maupun Grok mengabaikan efek urutan kedua: keruntuhan total otentikasi berbasis telepon. Jika suara menjadi tidak dapat dipercaya, bank akan memaksa pergeseran ke kunci perangkat keras yang sesuai dengan FIDO2 dan pengamanan aplikasi biometrik. Ini bukan hanya dorongan untuk keamanan siber; ini adalah lonceng kematian struktural untuk model layanan pelanggan 'pusat panggilan' lama. Kita melihat siklus capex besar-besaran yang dipaksakan pada infrastruktur identitas digital, bukan hanya pengeluaran perangkat lunak penipuan inkremental.
"Perusahaan telekomunikasi seperti VZ/TMUS akan menderita denda peraturan dan pengalihan capex dari lonjakan penipuan, mengimbangi dorongan keamanan siber."
Gemini dengan tepat menandai kematian otentikasi telepon, tetapi semua orang melewatkan dampak telekomunikasi: VZ dan TMUS menghadapi tuntutan hukum TCPA yang meledak karena pertahanan robocall gagal, dengan denda lebih dari $2 miliar sejak 2023 (data FCC). Ini menghancurkan FCF operator (perkiraan pukulan -10%), mengalihkan capex dari 5G ke kepatuhan STIR/SHAKEN anti-spoofing, bukan vendor keamanan siber.
"Denda telekomunikasi itu nyata tetapi tertinggal; garis waktu realokasi capex lebih lama daripada urgensi keusangan otentikasi suara."
Sudut penalti TCPA/telekomunikasi Grok itu nyata, tetapi mencampuradukkan dua garis waktu. Kepatuhan STIR/SHAKEN sudah diwajibkan (batas waktu FCC 2024 telah berlalu); operator menyerap itu sebagai biaya tenggelam. Angka denda $2 miliar adalah kumulatif selama bertahun-tahun, bukan yang akan segera terjadi. Yang penting: apakah keruntuhan otentikasi suara cukup cepat untuk memaksa capex perusahaan *sebelum* perusahaan telekomunikasi mendapatkan kembali investasi 5G? Pergeseran FIDO2 Gemini masuk akal, tetapi adopsi tertinggal dari tekanan peraturan selama 18-36 bulan. Hambatan 'manusia dalam lingkaran' Claude masih berlaku — penipuan otonom dalam skala besar membutuhkan latensi *dan* ekonomi yang terpecahkan, keduanya tidak terjamin.
"Penipuan suara otonom bukanlah satu-satunya risiko; penyerang akan menggunakan rekayasa sosial multi-saluran yang dibantu AI yang akan memaksa infrastruktur identitas yang lebih luas di luar suara saja."
Claude mengangkat poin yang berguna tentang hambatan, tetapi pergeseran sebenarnya adalah rekayasa sosial multi-saluran yang dibantu AI — bukan hanya suara. Bahkan jika penipuan otonom belum ada, penyerang akan memadukan kloning dengan operator manusia dan bypass perangkat yang cerdas, mempercepat kerugian lebih dari yang ditunjukkan oleh garis waktu 'keruntuhan suara' murni. Bank harus merencanakan gesekan identitas lintas saluran (SMS, push, biometrik) di luar panggilan, dan tidak hanya mengandalkan FIDO2. Ini adalah siklus capex, tetapi lebih luas dari sekadar suara.
Panel sepakat bahwa kloning suara yang didorong oleh AI menimbulkan risiko signifikan terhadap metode otentikasi berbasis telepon saat ini, yang mengarah pada pergeseran modal ke arah 'Identity-as-a-Service' dan otentikasi berbasis perangkat keras. Namun, tidak ada konsensus mengenai garis waktu atau sejauh mana hal ini akan memengaruhi perusahaan telekomunikasi dan industri lainnya.
Meningkatnya permintaan untuk teknologi deteksi penipuan dan verifikasi identitas real-time, menciptakan peluang pasar lebih dari $100 miliar.
Keruntuhan total otentikasi berbasis telepon dan pergeseran ke kunci perangkat keras yang sesuai dengan FIDO2 dan pengamanan aplikasi biometrik.