Искусственно интеллектные чат-боты стали умелыми ведениями разговоров, напоминающими человеческие. Однако существует значительная проблема - их склонность к предоставлению неточных или бессмысленных ответов, часто называемых "галлюцинациями". Для решения этой проблемы исследователи разработали потенциальное решение: использование чат-ботов для выявления ошибок, допущенных другими чат-ботами. Себастьян Фарквар, компьютерный ученый из Университета Оксфорд, сотрудничал над исследованием, опубликованным в журнале Nature, в котором предлагается использование чат-ботов, наподобие ChatGPT или Gemini от Google, для обнаружения ложных ответов, сгенерированных искусственным интеллектом. Чат-боты опираются на большие языковые модели (LLM), которые поглощают огромные объемы текста из интернета. Эти модели способны выполнять различные задачи, такие как предсказание следующего слова в предложении или генерация текста. С помощью проб и ошибок эти боты находят закономерности и настраивают свои модели на основе обратной связи от людей. Однако есть ограничение: чат-боты не могут понимать язык так же, как люди. Для оценки этого ограничения Фарквар и его команда задали вопросы одному чат-боту и попросили другого чат-бота проверить ответы на противоречия. Этот подход похож на тактику, используемую правоохранительными органами при допросах подозреваемых с целью запутать их. Если ответы имели значительно разные значения, это указывало на то, что они, скорее всего, были запутанными или ошибочными. Исследовательская команда сравнила оценку чат-бота с оценкой человека по тому же набору вопросов для проверки точности.
Они выявили, что согласие чат-бота с оценщиками-людьми составило 93%, в то время как согласованность оценщиков-людей составила 92%. Это сходство успокоило Фарквара и указывает на то, что оценка чат-ботами друг друга не является существенной проблемой. Фарквар объяснил, что идентификация ошибок искусственного интеллекта часто представляет сложность для обычного читателя. При использовании LLM для своей работы у него возникают трудности в замечании таких аномалий, поскольку чат-боты часто "говорят то, что вы хотите услышать" и могут выдумывать такие вещи, которые кажутся правдоподобными и полезными, но исследователи называют их "лизоблюдством". Ненадежные ответы, предоставленные чат-ботами, затрудняют широкое внедрение искусственного интеллекта в чат-ботах, особенно в критических областях, таких как радиология, где они могут представлять риски для жизни человека. Они также могут способствовать распространению поддельных юридических прецедентов или фейковых новостей. Тем не менее, не все убеждены в целесообразности использования чат-ботов для оценки ответов других чат-ботов. В смежной статье в Nature Карин Верспур, профессор РМИТ Университета, выразила опасения о "борьбе огнем с огнем". Она указала на то, что количество ошибок, генерируемых LLM, кажется уменьшаться, когда второй чат-бот группирует ответы по семантически похожим кластерам. Однако Верспур выражает сомнения в эффективности использования LLM для оценки метода, основанного на LLM, так как это может привести к предвзятости и цикличности. Фарквар считает этот подход аналогичным строительству деревянного дома на деревянных балках, уделяя внимание аспекту укрепления.
None
Компания Salesforce опубликовала подробный отчёт о торговом событии Cyber Week 2025, проанализировав данные более 1,5 миллиарда глобальных покупателей.
Технологии искусственного интеллекта (ИИ) стали центральной силой в преобразовании ландшафта цифровой рекламы.
За последние два года резкий рост технологических акций обогатил многих инвесторов, и хотя уже радуются успехам компаний like Nvidia, Alphabet и Palantir Technologies, важно искать следующую большую возможность.
В последние годы города по всему миру все активнее внедряют искусственный интеллект (ИИ) в системы видеонаблюдения для улучшения контроля за общественными пространствами.
Поиск вышел за рамки голубых ссылок и списков ключевых слов; теперь люди задают вопросы напрямую AI-инструментам, таким как Google SGE, Bing AI и ChatGPT.
Мы хотели бы узнать больше о том, как недавние изменения в поведении поиска в интернете, вызванные ростом искусственного интеллекта, повлияли на ваш бизнес.
Дэнни Sullivan из Google дал рекомендации SEO-специалистам, работающим с клиентами, которые стремятся получать обновления по стратегиям AI-SEO.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today