News
>
Chatbot AI Menghadapi Isu Halusinasi Berterusan yang Mengganggu Kebolehpercayaan

Auto-Filling SEO Website as a Gift

Launch Your AI-Powered Business and get clients!

No advertising investment needed—just results. AI finds, negotiates, and closes deals automatically

May 10, 2025, 5:50 p.m.

Chatbot AI Menghadapi Isu Halusinasi Berterusan yang Mengganggu Kebolehpercayaan

Bot perbualan AI dari syarikat teknologi terkemuka seperti OpenAI dan Google telah menerima peningkatan penalaran dalam beberapa bulan kebelakangan ini untuk meningkatkan keberhasilan jawapan. Walau bagaimanapun, ujian terkini mendedahkan bahawa beberapa model yang lebih baharu beraksi lebih buruk berbanding versi terdahulu, menunjukkan fenomena yang dipanggil "halusinasi"—kesilapan di mana bot perbualan menghasilkan maklumat palsu atau memberikan jawapan yang secara fakta betul tetapi tidak relevan atau tidak mengikut arahan. Masalah ini telah wujud sejak kewujudan model bahasa besar (LLMs) seperti ChatGPT dari OpenAI dan Gemini dari Google, dan nampaknya tidak mungkin diselesaikan sepenuhnya. Laporan teknikal OpenAI menunjukkan bahawa model o3 dan o4-mini yang dikeluarkan pada April mempunyai kadar halusinasi yang jauh lebih tinggi berbanding model o1 yang lebih lama dari akhir 2024: o3 mempunyai kadar halusinasi 33%, o4-mini 48%, berbanding 16% untuk o1, semasa merumuskan fakta yang tersedia kepada umum. Begitu juga, penjejak kedudukan Vectara yang mengesan kadar halusinasi mendapati bahawa beberapa model penalaran—termasuk DeepSeek-R1—mengalami peningkatan ketara dalam halusinasi berbanding pendahulunya, walaupun mereka menggunakan pendekatan penalaran pelbagai langkah sebelum menjawab. OpenAI menegaskan bahawa proses penalaran tidak secara intrinsiknya bertanggungjawab terhadap kenaikan halusinasi dan sedang aktif menjalankan kajian untuk mengurangkan halusinasi dalam semua model. Keberlanjutan halusinasi ini mengancam beberapa aplikasi: model yang sering menghasilkan pembohongan menyukarkan bantuan penyelidikan; bot peguam paralegal yang memetik kes yang tidak wujud berisiko menyebabkan kesilapan undang-undang; bot khidmat pelanggan dengan maklumat yang sudah usang menyebabkan masalah operasi. Pada mulanya, syarikat AI menjangkakan halusinasi akan berkurang dari masa ke masa kerana kemas kini model awal menunjukkan penambahbaikan. Namun, tahap halusinasi yang lebih tinggi baru-baru ini mencabar pandangan ini, tanpa mengira penglibatan penalaran. Penjejak kedudukan Vectara menunjukkan kadar halusinasi adalah hampir sama dalam model yang menggunakan penalaran dan yang tidak dari OpenAI dan Google, walaupun angka tepat kurang penting berbanding kedudukan relatif.

Google enggan memberi komen. Bagaimanapun, penilaian seperti ini mempunyai kelemahan. Ia menggabungkan pelbagai jenis halusinasi; contohnya, kadar halusinasi 14. 3% DeepSeek-R1 kebanyakan terdiri daripada kes "baik hati"—jawapan yang secara logik sah dan disokong oleh pengetahuan tetapi tidak terdapat dalam teks sumber. Selain itu, ujian berasaskan permintaan penjumlahan teks sahaja mungkin tidak mencerminkan kekerapan halusinasi dalam tugasan lain, kerana LLM tidak direka khas untuk meringkaskan. Emily Bender dari University of Washington menekankan bahawa model ini lebih cenderung untuk meramalkan perkataan seterusnya yang mungkin daripada memproses maklumat untuk memahami teks secara sebenar, menjadikan istilah "halusinasi" sebagai sesuatu yang mengelirukan dan antropomorfik. Bender mengkritik "halusinasi" kerana ia menimbulkan tanggapan bahawa kesilapan adalah anomali dalam sistem yang biasanya boleh dipercayai dan memberi persepsi manusia kepada AI, yang tidak "mempersepsi" dalam apa jua erti. Arvind Narayanan dari Princeton menambah bahawa model juga membuat kesilapan dengan bergantung kepada data yang tidak boleh dipercayai atau usang, dan hanya menambah data latihan atau kuasa pengiraan tidak menyelesaikan masalah ini. Akibatnya, AI yang sering membuat kesilapan mungkin merupakan realiti yang kekal. Narayanan mencadangkan menggunakan model sebegini hanya apabila semakan fakta lebih cepat berbanding menjalankan penyelidikan asal, manakala Bender mencadangkan untuk mengelakkan bergantung kepada bot perbualan AI untuk maklumat fakta sama sekali.

News source

Brief news summary

Kemajuan terkini dalam chatbot AI oleh syarikat seperti OpenAI dan Google, yang fokus kepada peningkatan kebolehan penalaran dan ketepatan, secara paradoxically telah menyebabkan peningkatan kadar halusinasi—iaitu keadaan di mana model menghasilkan maklumat palsu atau menyesatkan dan gagal mematuhi arahan dengan betul. Sebagai contoh, model terbaru OpenAI seperti o3 dan o4-mini menunjukkan kadar halusinasi sebanyak 33% dan 48%, berbanding 16% untuk model o1 yang lebih lama, dengan trend yang serupa turut diperhatikan dalam model seperti DeepSeek-R1. Walaupun menghadapi cabaran ini, OpenAI menegaskan bahawa komponen penalaran bukanlah punca dan mereka terus berusaha mengurangkan halusinasi tersebut. Isu ini amat kritikal dalam bidang seperti penyelidikan, nasihat guaman, dan khidmat pelanggan, di mana ketidaktepatan boleh membawa akibat serius. Penilaian oleh Vectara mendedahkan perbezaan yang minima dalam kekerapan halusinasi antara model yang mengutamakan penalaran dan yang tidak, walaupun data yang tersedia masih terhad. Pakar memperingatkan bahawa istilah “halusinasi” terlalu menyederhanakan masalah kompleks yang melibatkan kebergantungan kepada data yang sudah ketinggalan zaman atau tidak boleh dipercayai. Memandangkan ketidaktepatan yang berterusan, sebahagian pihak mencadangkan agar penggunaan chatbot AI dihadkan kepada situasi di mana pengesahan maklumat lebih mudah berbanding pemeriksaan fakta secara bebas. Secara keseluruhan, halusinasi kekal sebagai masalah utama yang belum selesai dalam model bahasa AI.

Business on autopilot

AI-powered Lead Generation in Social Media
and Search Engines

Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment

Language

Learn how AI can help your business.
Let’s talk!

May 10, 2025, 9:47 p.m.

Robinhood Sedang Membangunkan Program Berasaskan …

Robinhood sedang membangunkan sebuah platform berasaskan blockchain yang bertujuan memberi akses kepada peniaga Eropah kepada aset kewangan AS, menurut dua sumber yang biasa dengan situasi tersebut yang berbicara kepada Bloomberg.

May 10, 2025, 9:02 p.m.

OpenAI Lancarkan o3-mini: Model AI Pantas, Bijak,…

OpenAI telah memperkenalkan o3-mini, satu model berfikir buatan kecerdasan buatan baharu yang direka khas untuk meningkatkan ketepatan dalam pengiraan matematik, tugasan pengekodan, dan penyelesaian masalah saintifik.

May 10, 2025, 8:22 p.m.

Pelancaran USDT oleh Tether di Rantaian Kaia, Mel…

Penerbit stablecoin Tether telah mengumumkan pelancaran stablecoin asli mereka, USDT, di rangkaian Kaia, sebuah rangkaian Layer 1 yang dilancarkan pada Ogos 2024.

May 10, 2025, 7:29 p.m.

Elton John dan Dua Lipa mencari perlindungan dari…

Dua Lipa, Sir Elton John, Sir Ian McKellen, Florence Welch, dan lebih daripada 400 ahli muzik, penulis, dan artis British lain telah mendesak Perdana Menteri Sir Keir Starmer supaya mengemas kini undang-undang hak cipta bagi melindungi pencipta daripada penyalahgunaan karya mereka oleh kecerdasan buatan (AI).

May 10, 2025, 6:49 p.m.

Peranan Blockchain dalam Inisiatif Kemudahan Kewa…

Teknologi blockchain semakin diiktiraf sebagai alat yang berkuasa untuk memajukan penyertaan kewangan secara global, khususnya untuk penduduk yang tidak mempunyai akses kepada perbankan dan yang kurang mendapat layanan, yang sering kali terpinggir daripada sistem kewangan konvensional.

May 10, 2025, 5:14 p.m.

Blockchain dalam Penjagaan Kesihatan: Menjamin Ke…

Industri penjagaan kesihatan sedang melalui transformasi besar dengan mengadopsi teknologi blockchain untuk meningkatkan keselamatan dan pengurusan rekod kesihatan pesakit.

May 10, 2025, 4:16 p.m.

Paus Leo XIV memaparkan visinya dan mengenal past…

VATICAN CITY (AP) — Pada hari Sabtu, Pope Leo XIV menggariskan visi untuk kepausannya, menyoroti kecerdasan buatan (AI) sebagai cabaran utama yang dihadapi manusia dan berikrar untuk meneruskan keutamaan utama yang ditetapkan oleh Pope Francis.

All news

Launch Your AI-Powered Business and get clients!

Chatbot AI Menghadapi Isu Halusinasi Berterusan yang Mengganggu Kebolehpercayaan

News source

Brief news summary

AI-powered Lead Generation in Social Media
and Search Engines

I'm your Content Manager, ready to handle your first test assignment

Content Maker

Last news

Robinhood Kembangkan Platform Blockchain untuk Pedagang Eropah Mengakses Aset AS

OpenAI Lancarkan o3-mini: Model AI Mampu Milik dan Tepat untuk Matematik, Pengaturcaraan & Sains

Tether Melancarkan Stablecoin USDT di Rangkaian Kaia dan Mengintegrasikan dengan LINE Mini Dapps

The Best for your Business

Learn how AI can help your business.
Let’s talk!

Robinhood Sedang Membangunkan Program Berasaskan …

OpenAI Lancarkan o3-mini: Model AI Pantas, Bijak,…

Pelancaran USDT oleh Tether di Rantaian Kaia, Mel…

Elton John dan Dua Lipa mencari perlindungan dari…

Peranan Blockchain dalam Inisiatif Kemudahan Kewa…

Blockchain dalam Penjagaan Kesihatan: Menjamin Ke…

Paus Leo XIV memaparkan visinya dan mengenal past…

Sales

Marketing

Customer Service

Launch Your AI-Powered Business and get clients!

Chatbot AI Menghadapi Isu Halusinasi Berterusan yang Mengganggu Kebolehpercayaan

News source

Brief news summary

AI-powered Lead Generation in Social Media and Search Engines

I'm your Content Manager, ready to handle your first test assignment

Content Maker

Last news

Robinhood Kembangkan Platform Blockchain untuk Pedagang Eropah Mengakses Aset AS

OpenAI Lancarkan o3-mini: Model AI Mampu Milik dan Tepat untuk Matematik, Pengaturcaraan & Sains

Tether Melancarkan Stablecoin USDT di Rangkaian Kaia dan Mengintegrasikan dengan LINE Mini Dapps

The Best for your Business

Learn how AI can help your business. Let’s talk!

Robinhood Sedang Membangunkan Program Berasaskan …

OpenAI Lancarkan o3-mini: Model AI Pantas, Bijak,…

Pelancaran USDT oleh Tether di Rantaian Kaia, Mel…

Elton John dan Dua Lipa mencari perlindungan dari…

Peranan Blockchain dalam Inisiatif Kemudahan Kewa…

Blockchain dalam Penjagaan Kesihatan: Menjamin Ke…

Paus Leo XIV memaparkan visinya dan mengenal past…

Your News is ready

Your article is ready

Generating video takes longer than text.

Join our community of experts

Reasons why you should be part of the experts community

Welcome to Neuron Expert!

Launch Your AI-Powered Business

Auto-Filling SEO Website as a Gift

AI Marketing Across All Social Media

AI Sales Manager + CRM

Support

Content Maker

Topic

Specify the topic (Optional)

Link (Optional)

Learn how to craft press releases, create unique social media posts, write SEO-optimized articles for websites, and produce videos, all from a single source

AI-powered Lead Generation in Social Media
and Search Engines

Learn how AI can help your business.
Let’s talk!