2023 жылдың ақпан айында Google's AI чатботы Bard Джеймс Уэбб ғарыштық телескопының экзопланетаның алғашқы суретін түсіргенін қате мәлімдеген болатын, бұл OpenAI-дың ChatGPT жүйесінде кездескен қателіктерге ұқсас болды деп Purdue университетінің зерттеушілері анықтады, онда 500-ден астам бағдарламалау сұрақтарының жартысынан көбі дұрыс жауап бермеген. Қазіргі уақытта бұл қателіктер байқалып отырса да, сарапшылар AI модельдерінің күрделенген сайын шындықты орында дұрыс емес ақпараттан ажырату қиын болатынына алаңдауда. NYU-ден Джулиан Майкл AI жүйелерін адам қабілетінен тыс салаларда қадағалаудың қиындығын атап өтеді. Ұсынылған шешімдердің бірі – екі үлкен AI моделі пікірталасқа түсіп, жеңіл модель немесе адам ең дұрыс нәтижені анықтайды. Бұл идея алты жыл бұрын пайда болған; бірақ жақында Антропик пен Google DeepMind зерттеулері LLM пікірталастары шындықты анықтауға көмектесетініне алғашқы эмпирикалық дәлелдер ұсынады. Сенімді AI жүйелерін құру, AI-дың адам құндылықтарына сай келуін қамтамасыз ету, бүгінгі күнде адамның пікіріне тәуелді. Ал болашақта AI-дың адам мүмкіндігінен жоғары дәлдігін қамтамасыз ету үшін, ауқымды бақылаудың қажеті бар. 2018 жылдан бері зерттеліп келе жатқан пікірталас, бұл ауқымды бақылауды басқару әдісі ретінде қарастырылады. Алғашында OpenAI-дан Джеффри Ирвинг ұсынған бұл техника сұрақты даулау арқылы екі AI моделінің сыртқы төрешіні өздерінің дұрыстығына сендіруге тырысады. 2018 жылғы қарапайым сынақтар пікірталастың жұмыс жасай алатынын көрсеткенімен, адамның субъективті пікірі мен бағалау қабілетіндегі айырмашылықтары назарда болды.
Аманда Аскелл секілді зерттеушілер AI-ды адам құндылықтарына тиімді сәйкестендіру үшін адамның шешім қабылдауын түсіну маңызды деп санайды. Алғашқы нәтижелер әртүрлі болғанымен, жаңа зерттеулер потенциалды көрсетуде. Антропиктің зерттеуі көрсеткендей, LLM пікірталастары сыртқы төрешінің дәлдігін айтарлықтай жақсартты, оны 54%-дан 76%-ға дейін арттырды. Google DeepMind-тың ұқсас эксперименттері пікірталастың әртүрлі тапсырмалар төңірегінде дәлдікке әкелгенін растады. Зекара Кентон екі жақты талқылануы төрешілерге көбірек ақпарат беретінін және олардың неғұрлым дұрыс қорытындыларға келуіне ықпал ететінін айтады. Дегенмен, әлі де шешімін таппаған мәселелер бар, мысалы, пікірталастағы маңызы жоқ элементтердің әсері және қолданушының талғамын қателесіп қайталау. Сонымен қатар, тестердегі дұрыс немесе бұрыс жауаптардың тұрақты сипаты күрделі, күрделі нақты өмірлік сценарийлерге аударылмауы мүмкін. Ирвинг атап өткендей, AI-дың мінез-құлқын түсіну және AI жүйелері білімде адам төрешілерінен асып түсетін жерлерді анықтау осы әдістерді дамытудың және қолданудың негізгі аспектілері болып табылады. Бұл қиындықтарға қарамастан, пікірталастардың эмпирикалық жетістігі AI сенімділігі мен сәйкестілігін арттыруға бағытталған маңызды қадам болып табылады.
Кешенді тапсырмаларда шешім қабылдаудың дәлдігін арттыратын AI-талқылау әдісі.
Әлеуметтік желілер платформалары видео мазмұнын модерациялау үшін жасанды интеллектті (ЖИ) пайдалану деңгейін арттырып келеді, онлайн коммуникацияның негізгі түрі ретінде видеолар санының күрт өсуіне байланысты.
КОНГРЕСС ӨЗГЕРІСТЕРІ: Жылдар бойы қатаңдатылған шектеулерден кейін, Nvidia компаниясының H200 чиптерін Қытайға сату рұқсатын беру туралы шешім кейбір Республикалықтардан қарсыластарды тудырды.
Жасанды интеллекттің әсерімен болған қысқартулар 2025 жылғы жұмыс нарығын белгіледі.
RankOS™ брендтердің көрінуін және цитаталар санын Perplexity AI мен басқа да жауап іздеу платформаларында арттырады Perplexity SEO агенттік қызметтері Нью-Йорк, 2025 жылғы 19 желтоқсан (GLOBE NEWSWIRE) — NEWMEDIA
Бұл мақаланың бастапқы нұсқасы CNBC-нің Inside Wealth бюллетенінде жарияланған, оны Роберт Франк жазған.
Тақырыптар Disney-дің OpenAI-ға миллиардтап инвестиция салуын басты назарға алды және Disney неге Google-ды емес, OpenAI-ды таңдағанын талқылап жатыр, оларды заңсыз авторлық құқықты бұзғаны үшін соттайды.
Salesforce 2025 Жоғары Технологиялар Сауда апталығы туралы толық есеп шығарып, әлемдік 1,5 миллиардтан астам сатып алушының деректерін талдады.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today