lang icon Indonesian
Auto-Filling SEO Website as a Gift

Launch Your AI-Powered Business and get clients!

No advertising investment needed—just results. AI finds, negotiates, and closes deals automatically

May 10, 2025, 5:50 p.m.
2

Chatbot AI Menghadapi Masalah Halusinasi yang Persisten yang Mempengaruhi Keandalan

Chatbot AI dari perusahaan teknologi terkemuka seperti OpenAI dan Google telah menerima peningkatan kemampuan penalaran dalam beberapa bulan terakhir untuk meningkatkan keandalan jawaban. Namun, pengujian terbaru menunjukkan bahwa beberapa model yang lebih baru justru berkinerja lebih buruk daripada versi sebelumnya, menunjukkan fenomena yang disebut "halusinasi"—kesalahan di mana chatbot menghasilkan informasi palsu atau memberikan jawaban yang secara faktual benar tetapi tidak relevan atau tidak sesuai dengan instruksi. Masalah ini telah berlangsung sejak awal model bahasa besar (LLMs) seperti ChatGPT dari OpenAI dan Gemini dari Google, dan tampaknya kecil kemungkinan untuk sepenuhnya diselesaikan. Laporan teknis dari OpenAI menunjukkan bahwa model o3 dan o4-mini yang dirilis pada bulan April memiliki tingkat halusinasi yang jauh lebih tinggi dibandingkan dengan model o1 yang lebih lama dari akhir 2024: o3 memiliki tingkat halusinasi sebesar 33%, o4-mini 48%, dibandingkan dengan 16% untuk o1 saat merangkum fakta yang tersedia secara umum. Demikian pula, papan peringkat Vectara yang melacak tingkat halusinasi menemukan bahwa beberapa model penalaran—termasuk DeepSeek-R1—mengalami peningkatan halusinasi yang signifikan dibandingkan pendahulunya, meskipun mereka menggunakan pendekatan penalaran multi-langkah sebelum menjawab. OpenAI menegaskan bahwa proses penalaran secara inheren tidak bertanggung jawab terhadap peningkatan halusinasi dan sedang aktif meneliti cara-cara untuk mengurangi halusinasi di semua model. Ketahanan halusinasi ini mengancam berbagai aplikasi: model yang sering menghasilkan kebohongan menghambat bantuan penelitian; bot paralegal yang merujuk kasus yang tidak ada berisiko melakukan kesalahan hukum; bot layanan pelanggan dengan informasi yang usang menyebabkan masalah operasional. Awalnya, perusahaan AI berharap halusinasi akan berkurang seiring waktu, karena pembaruan model awal menunjukkan peningkatan. Namun, tingkat halusinasi yang lebih tinggi baru-baru ini menantang pandangan tersebut, terlepas dari keterlibatan proses penalaran. Papan peringkat Vectara menunjukkan bahwa tingkat halusinasi cukup seimbang antara model yang menggunakan penalaran dan yang tidak dari OpenAI dan Google, meskipun angka pasti kurang penting dibandingkan peringkat relatif.

Google menolak memberikan komentar. Namun, peringkat tersebut memiliki keterbatasan. Mereka menggabungkan berbagai jenis halusinasi; misalnya, tingkat halusinasi 14, 3% dari DeepSeek-R1 sebagian besar terdiri dari kasus "baik-baik saja"—jawaban yang secara logis masuk akal dan didukung oleh pengetahuan tetapi tidak tercantum dalam teks sumber. Selain itu, pengujian yang didasarkan semata-mata pada ringkasan teks mungkin tidak merefleksikan frekuensi halusinasi dalam tugas-tugas lain, karena LLM tidak dirancang khusus untuk merangkum. Emily Bender dari University of Washington menekankan bahwa model-model ini memprediksi kata berikut yang paling mungkin, bukan memproses informasi untuk benar-benar memahami teks, sehingga istilah "halusinasi" menjadi ambigu dan menganggap manusiawi. Bender mengkritik "halusinasi" sebagai masalah karena menyiratkan bahwa kesalahan adalah penyimpangan dari sistem yang seharusnya andal dan mengatributkan persepsi manusiawi kepada AI, padahal AI tidak "mengamati" dalam arti apa pun. Arvind Narayanan dari Princeton menambahkan bahwa model juga keliru karena bergantung pada data yang tidak dapat diandalkan atau usang, dan hanya menambahkan data pelatihan atau kekuatan komputasi tidak menyelesaikan masalah ini. Akibatnya, AI yang mudah membuat kesalahan mungkin menjadi kenyataan yang terus berlangsung. Narayanan menyarankan menggunakan model semacam itu hanya saat pemeriksaan fakta lebih cepat daripada melakukan riset asli, sementara Bender merekomendasikan untuk menghindari ketergantungan sepenuhnya pada chatbot AI untuk informasi faktual.



Brief news summary

Kemajuan terbaru dalam chatbot AI oleh perusahaan seperti OpenAI dan Google, yang fokus pada peningkatan penalaran dan akurasi, secara paradoks justru meningkatkan tingkat halusinasi—kejadian di mana model menghasilkan informasi palsu atau menyesatkan dan gagal mengikuti instruksi dengan benar. Sebagai contoh, model terbaru OpenAI seperti o3 dan o4-mini menunjukkan tingkat halusinasi sebesar 33% dan 48%, dibandingkan dengan 16% pada model o1 yang lebih lama, dengan tren serupa ditemukan pada model seperti DeepSeek-R1. Meski menghadapi tantangan ini, OpenAI menyatakan bahwa komponen penalaran bukan penyebab utama dan mereka terus berupaya mengurangi tingkat halusinasi. Isu ini sangat kritis di bidang seperti riset, nasihat hukum, dan layanan pelanggan, di mana ketidakakuratan dapat berakibat serius. Evaluasi oleh Vectara mengungkapkan perbedaan minimal dalam frekuensi halusinasi antara model yang menggunakan penalaran dan yang tidak, meski data yang tersedia masih terbatas. Para ahli memperingatkan bahwa istilah “halusinasi” menyederhanakan masalah kompleks yang melibatkan ketergantungan pada data usang atau tidak dapat diandalkan. Mengingat ketidakakuratan yang terus berlanjut, beberapa orang menyarankan untuk membatasi penggunaan chatbot AI pada situasi di mana verifikasi informasi lebih mudah dilakukan daripada pemeriksaan fakta secara mandiri. Secara keseluruhan, halusinasi tetap menjadi masalah utama yang belum terselesaikan dalam model bahasa AI.
Business on autopilot

AI-powered Lead Generation in Social Media
and Search Engines

Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment

Language

Content Maker

Our unique Content Maker allows you to create an SEO article, social media posts, and a video based on the information presented in the article

news image

Last news

The Best for your Business

Learn how AI can help your business.
Let’s talk!

May 10, 2025, 9:47 p.m.

Robinhood Mengembangkan Program Berbasis Blockcha…

Robinhood sedang mengembangkan platform berbasis blockchain yang bertujuan memberikan akses kepada pedagang Eropa untuk aset keuangan AS, menurut dua sumber yang akrab dengan situasi tersebut yang berbicara kepada Bloomberg.

May 10, 2025, 9:02 p.m.

OpenAI Luncurkan o3-mini: Model AI Cepat, Cerdas,…

OpenAI telah memperkenalkan o3-mini, sebuah model penalaran kecerdasan buatan baru yang dirancang khusus untuk meningkatkan akurasi dalam perhitungan matematis, tugas pengkodean, dan pemecahan masalah ilmiah.

May 10, 2025, 8:22 p.m.

USDT Tether Diluncurkan di Blockchain Kaia, Perlu…

Penerbit stablecoin Tether mengumumkan peluncuran stablecoin USDT asli mereka di blockchain Kaia, sebuah jaringan Layer 1 yang diluncurkan pada Agustus 2024.

May 10, 2025, 7:29 p.m.

Elton John dan Dua Lipa mencari perlindungan dari…

Dua Lipa, Sir Elton John, Sir Ian McKellen, Florence Welch, dan lebih dari 400 musisi, penulis, dan seniman Inggris lainnya mendesak Perdana Menteri Sir Keir Starmer untuk memperbarui undang-undang hak cipta guna melindungi pencipta dari penyalahgunaan karya mereka oleh kecerdasan buatan (AI).

May 10, 2025, 6:49 p.m.

Peran Blockchain dalam Inisiatif Inklusi Keuangan

Teknologi blockchain semakin diakui sebagai alat yang ampuh untuk meningkatkan inklusi keuangan secara global, terutama bagi populasi yang tidak memiliki akses ke layanan perbankan dan kurang terlayani, yang seringkali menghadapi keterbatasan peluang ekonomi akibat terisolasi dari sistem keuangan konvensional.

May 10, 2025, 5:14 p.m.

Blockchain dalam Perawatan Kesehatan: Mengamankan…

Industri layanan kesehatan sedang mengalami transformasi besar dengan mengadopsi teknologi blockchain untuk meningkatkan keamanan dan pengelolaan catatan kesehatan pasien.

May 10, 2025, 4:16 p.m.

Paus Leo XIV menyusun visinya dan mengidentifikas…

KOTA Vatikan (AP) — Pada hari Sabtu, Paus Leo XIV menguraikan visi untuk papanya, menyoroti kecerdasan buatan (AI) sebagai tantangan penting yang dihadapi umat manusia dan berjanji untuk melanjutkan prioritas utama yang ditetapkan oleh Paus Fransiskus.

All news