lang icon En
Nov. 8, 2024, 2:14 p.m.
3495

Кешенді тапсырмаларда шешім қабылдаудың дәлдігін арттыратын AI-талқылау әдісі.

Brief news summary

2023 жылдың ақпан айында Google-дың Bard атты AI чат-боты Джеймс Уэбб ғарыш телескопы туралы қате мәлімет берген кезде AI-дың дәлдігіне қатысты мәселелер пайда болды. Purdue университетінің зерттеуі ChatGPT-тың бағдарламалау жауабының жартысынан көбі қате екенін көрсетті. Мұндай қателер қазір байқалмай жатса да, Нью-Йорк университетінің сарапшысы Джулиан Майкл сияқты мамандар болашақта AI модельдерінің күрделі, тексерілмейтін жауаптар жасауы сенімділікті төмендетуі мүмкін деп алаңдаушылық білдіруде. Шешім ретінде AI модельдерін бір-бірімен пікірталас жасату арқылы адам немесе AI төрешісі шындықты анықтауда көмек көрсете алады. Anthropic және Google DeepMind зерттеулері пікірталас арқылы модельдерді оқыту дәлдікті арттыратынын көрсетеді. Алайда, бейтараптылық, әртүрлі тапсырмалар бойынша сенімділік және адамдық құндылықтарға сәйкестік сияқты мәселелер әлі де бар. Осы мәселелерге қарамастан, AI пікірталастары мен бақылау әдістері арқылы жүргізіліп жатқан эксперименттер AI сенімділігін жақсартуға үміт береді. Зерттеушілер AI пікірталастары болашақта AI қауіпсіздігі мен сәйкестігіне айтарлықтай үлес қоса алады деп үміттенеді.

2023 жылдың ақпан айында Google's AI чатботы Bard Джеймс Уэбб ғарыштық телескопының экзопланетаның алғашқы суретін түсіргенін қате мәлімдеген болатын, бұл OpenAI-дың ChatGPT жүйесінде кездескен қателіктерге ұқсас болды деп Purdue университетінің зерттеушілері анықтады, онда 500-ден астам бағдарламалау сұрақтарының жартысынан көбі дұрыс жауап бермеген. Қазіргі уақытта бұл қателіктер байқалып отырса да, сарапшылар AI модельдерінің күрделенген сайын шындықты орында дұрыс емес ақпараттан ажырату қиын болатынына алаңдауда. NYU-ден Джулиан Майкл AI жүйелерін адам қабілетінен тыс салаларда қадағалаудың қиындығын атап өтеді. Ұсынылған шешімдердің бірі – екі үлкен AI моделі пікірталасқа түсіп, жеңіл модель немесе адам ең дұрыс нәтижені анықтайды. Бұл идея алты жыл бұрын пайда болған; бірақ жақында Антропик пен Google DeepMind зерттеулері LLM пікірталастары шындықты анықтауға көмектесетініне алғашқы эмпирикалық дәлелдер ұсынады. Сенімді AI жүйелерін құру, AI-дың адам құндылықтарына сай келуін қамтамасыз ету, бүгінгі күнде адамның пікіріне тәуелді. Ал болашақта AI-дың адам мүмкіндігінен жоғары дәлдігін қамтамасыз ету үшін, ауқымды бақылаудың қажеті бар. 2018 жылдан бері зерттеліп келе жатқан пікірталас, бұл ауқымды бақылауды басқару әдісі ретінде қарастырылады. Алғашында OpenAI-дан Джеффри Ирвинг ұсынған бұл техника сұрақты даулау арқылы екі AI моделінің сыртқы төрешіні өздерінің дұрыстығына сендіруге тырысады. 2018 жылғы қарапайым сынақтар пікірталастың жұмыс жасай алатынын көрсеткенімен, адамның субъективті пікірі мен бағалау қабілетіндегі айырмашылықтары назарда болды.

Аманда Аскелл секілді зерттеушілер AI-ды адам құндылықтарына тиімді сәйкестендіру үшін адамның шешім қабылдауын түсіну маңызды деп санайды. Алғашқы нәтижелер әртүрлі болғанымен, жаңа зерттеулер потенциалды көрсетуде. Антропиктің зерттеуі көрсеткендей, LLM пікірталастары сыртқы төрешінің дәлдігін айтарлықтай жақсартты, оны 54%-дан 76%-ға дейін арттырды. Google DeepMind-тың ұқсас эксперименттері пікірталастың әртүрлі тапсырмалар төңірегінде дәлдікке әкелгенін растады. Зекара Кентон екі жақты талқылануы төрешілерге көбірек ақпарат беретінін және олардың неғұрлым дұрыс қорытындыларға келуіне ықпал ететінін айтады. Дегенмен, әлі де шешімін таппаған мәселелер бар, мысалы, пікірталастағы маңызы жоқ элементтердің әсері және қолданушының талғамын қателесіп қайталау. Сонымен қатар, тестердегі дұрыс немесе бұрыс жауаптардың тұрақты сипаты күрделі, күрделі нақты өмірлік сценарийлерге аударылмауы мүмкін. Ирвинг атап өткендей, AI-дың мінез-құлқын түсіну және AI жүйелері білімде адам төрешілерінен асып түсетін жерлерді анықтау осы әдістерді дамытудың және қолданудың негізгі аспектілері болып табылады. Бұл қиындықтарға қарамастан, пікірталастардың эмпирикалық жетістігі AI сенімділігі мен сәйкестілігін арттыруға бағытталған маңызды қадам болып табылады.


Watch video about

Кешенді тапсырмаларда шешім қабылдаудың дәлдігін арттыратын AI-талқылау әдісі.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 21, 2025, 1:44 p.m.

Жасанды Интеллект видеоконтентті модерациялау құр…

Әлеуметтік желілер платформалары видео мазмұнын модерациялау үшін жасанды интеллектті (ЖИ) пайдалану деңгейін арттырып келеді, онлайн коммуникацияның негізгі түрі ретінде видеолар санының күрт өсуіне байланысты.

Dec. 21, 2025, 1:38 p.m.

АҚШ жасанды интеллект чиптері бойынша экспорт шек…

КОНГРЕСС ӨЗГЕРІСТЕРІ: Жылдар бойы қатаңдатылған шектеулерден кейін, Nvidia компаниясының H200 чиптерін Қытайға сату рұқсатын беру туралы шешім кейбір Республикалықтардан қарсыластарды тудырды.

Dec. 21, 2025, 1:38 p.m.

2025 жылы жасанды интеллект 50 000-нан астам жұмы…

Жасанды интеллекттің әсерімен болған қысқартулар 2025 жылғы жұмыс нарығын белгіледі.

Dec. 21, 2025, 1:36 p.m.

Perplexity SEO Services іске қосылды – NEWMEDIA.C…

RankOS™ брендтердің көрінуін және цитаталар санын Perplexity AI мен басқа да жауап іздеу платформаларында арттырады Perplexity SEO агенттік қызметтері Нью-Йорк, 2025 жылғы 19 желтоқсан (GLOBE NEWSWIRE) — NEWMEDIA

Dec. 21, 2025, 1:22 p.m.

Эрик Шмидттің отбасы офисі 22 жасанды интеллект с…

Бұл мақаланың бастапқы нұсқасы CNBC-нің Inside Wealth бюллетенінде жарияланған, оны Роберт Франк жазған.

Dec. 21, 2025, 1:21 p.m.

Болашақ маркетингінің қысқаша мәлімдемесі: «жеткі…

Тақырыптар Disney-дің OpenAI-ға миллиардтап инвестиция салуын басты назарға алды және Disney неге Google-ды емес, OpenAI-ды таңдағанын талқылап жатыр, оларды заңсыз авторлық құқықты бұзғаны үшін соттайды.

Dec. 21, 2025, 9:34 a.m.

Salesforce мәліметтері жасанды интеллект пен аген…

Salesforce 2025 Жоғары Технологиялар Сауда апталығы туралы толық есеп шығарып, әлемдік 1,5 миллиардтан астам сатып алушының деректерін талдады.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today