lang icon En
June 20, 2024, 3:26 a.m.
1635

None

Brief news summary

Искусственно интеллектуальные чат-боты, хоть и владеют навыками общения с людьми, часто дают неточные или бессмысленные ответы. Однако исследователи предлагают решение: использование чат-ботов для выявления ошибок, допущенных другими чат-ботами. В исследовании, опубликованном в журнале Nature, исследователи обнаружили, что чат-боты, такие как ChatGPT и Gemini от Google, могут быть использованы для выявления ложных утверждений ИИ. Чат-боты используют большие языковые модели и обучаются методом проб и ошибок, но им недостает человекоподобного мышления и понимания. В рамках исследования один чат-бот отвечал на вопросы, а другой чат-бот проверял ответы на противоречия. Точность оценки чат-бота была сопоставлена с оценками людей, что показало высокую степень согласованности. Ненадежные ответы являются преградой для широкого использования чат-ботов ИИ, особенно в критических областях, таких как медицина и право. Однако не все эксперты уверены в эффективности использования чат-ботов для оценки других чат-ботов, так как это может усиливать ошибки и предубеждения.

Искусственно интеллектные чат-боты стали умелыми ведениями разговоров, напоминающими человеческие. Однако существует значительная проблема - их склонность к предоставлению неточных или бессмысленных ответов, часто называемых "галлюцинациями". Для решения этой проблемы исследователи разработали потенциальное решение: использование чат-ботов для выявления ошибок, допущенных другими чат-ботами. Себастьян Фарквар, компьютерный ученый из Университета Оксфорд, сотрудничал над исследованием, опубликованным в журнале Nature, в котором предлагается использование чат-ботов, наподобие ChatGPT или Gemini от Google, для обнаружения ложных ответов, сгенерированных искусственным интеллектом. Чат-боты опираются на большие языковые модели (LLM), которые поглощают огромные объемы текста из интернета. Эти модели способны выполнять различные задачи, такие как предсказание следующего слова в предложении или генерация текста. С помощью проб и ошибок эти боты находят закономерности и настраивают свои модели на основе обратной связи от людей. Однако есть ограничение: чат-боты не могут понимать язык так же, как люди. Для оценки этого ограничения Фарквар и его команда задали вопросы одному чат-боту и попросили другого чат-бота проверить ответы на противоречия. Этот подход похож на тактику, используемую правоохранительными органами при допросах подозреваемых с целью запутать их. Если ответы имели значительно разные значения, это указывало на то, что они, скорее всего, были запутанными или ошибочными. Исследовательская команда сравнила оценку чат-бота с оценкой человека по тому же набору вопросов для проверки точности.

Они выявили, что согласие чат-бота с оценщиками-людьми составило 93%, в то время как согласованность оценщиков-людей составила 92%. Это сходство успокоило Фарквара и указывает на то, что оценка чат-ботами друг друга не является существенной проблемой. Фарквар объяснил, что идентификация ошибок искусственного интеллекта часто представляет сложность для обычного читателя. При использовании LLM для своей работы у него возникают трудности в замечании таких аномалий, поскольку чат-боты часто "говорят то, что вы хотите услышать" и могут выдумывать такие вещи, которые кажутся правдоподобными и полезными, но исследователи называют их "лизоблюдством". Ненадежные ответы, предоставленные чат-ботами, затрудняют широкое внедрение искусственного интеллекта в чат-ботах, особенно в критических областях, таких как радиология, где они могут представлять риски для жизни человека. Они также могут способствовать распространению поддельных юридических прецедентов или фейковых новостей. Тем не менее, не все убеждены в целесообразности использования чат-ботов для оценки ответов других чат-ботов. В смежной статье в Nature Карин Верспур, профессор РМИТ Университета, выразила опасения о "борьбе огнем с огнем". Она указала на то, что количество ошибок, генерируемых LLM, кажется уменьшаться, когда второй чат-бот группирует ответы по семантически похожим кластерам. Однако Верспур выражает сомнения в эффективности использования LLM для оценки метода, основанного на LLM, так как это может привести к предвзятости и цикличности. Фарквар считает этот подход аналогичным строительству деревянного дома на деревянных балках, уделяя внимание аспекту укрепления.


Watch video about

None

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 21, 2025, 9:34 a.m.

Данные Salesforce показывают, что искусственный и…

Компания Salesforce опубликовала подробный отчёт о торговом событии Cyber Week 2025, проанализировав данные более 1,5 миллиарда глобальных покупателей.

Dec. 21, 2025, 9:28 a.m.

Влияние искусственного интеллекта на кампании циф…

Технологии искусственного интеллекта (ИИ) стали центральной силой в преобразовании ландшафта цифровой рекламы.

Dec. 21, 2025, 9:25 a.m.

Эта тихая компания в сфере ИИ может стать следующ…

За последние два года резкий рост технологических акций обогатил многих инвесторов, и хотя уже радуются успехам компаний like Nvidia, Alphabet и Palantir Technologies, важно искать следующую большую возможность.

Dec. 21, 2025, 9:24 a.m.

Системы видеонаблюдения на базе искусственного ин…

В последние годы города по всему миру все активнее внедряют искусственный интеллект (ИИ) в системы видеонаблюдения для улучшения контроля за общественными пространствами.

Dec. 21, 2025, 9:14 a.m.

Генеративная оптимизация движка (GEO): как повыси…

Поиск вышел за рамки голубых ссылок и списков ключевых слов; теперь люди задают вопросы напрямую AI-инструментам, таким как Google SGE, Bing AI и ChatGPT.

Dec. 21, 2025, 5:27 a.m.

Независимые бизнесы: повлиял ли рост искусственно…

Мы хотели бы узнать больше о том, как недавние изменения в поведении поиска в интернете, вызванные ростом искусственного интеллекта, повлияли на ваш бизнес.

Dec. 21, 2025, 5:23 a.m.

Гугл говорит, что сказать клиентам, которые хотят…

Дэнни Sullivan из Google дал рекомендации SEO-специалистам, работающим с клиентами, которые стремятся получать обновления по стратегиям AI-SEO.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today