Sept. 25, 2024, 7:19 a.m.
2319

Une étude révèle que les chatbots IA fournissent fréquemment des réponses incorrectes

Brief news summary

Une étude publiée dans *Nature* par José Hernández-Orallo de l'Institut de Recherche Valencien pour l'Intelligence Artificielle explore la performance des chatbots IA avancés, y compris le GPT d'OpenAI, le LLaMA de Meta, et le BLOOM de BigScience. La recherche met en évidence un problème significatif : plus de 60 % des réponses analysées se sont avérées incorrectes ou évasives, soulevant des inquiétudes quant à la compréhension par les utilisateurs des capacités de l'IA. L'étude a impliqué une analyse approfondie de milliers de questions et a révélé que des modèles comme GPT-4 tentent souvent de répondre à des questions complexes, augmentant ainsi la probabilité d'erreurs et conduisant les utilisateurs à faire confiance par erreur à ces inexactitudes. Hernández-Orallo recommande que les développeurs d'IA priorisent l'exactitude dans les requêtes plus simples et entraînent les modèles à éviter de répondre aux questions trop difficiles. Bien que certains modèles d'IA expriment leur incertitude avec des déclarations telles que 'Je ne sais pas', ils fournissent souvent des assurances dans des réponses incorrectes, ce qui peut amener les utilisateurs à surévaluer la fiabilité des systèmes d'IA.

Une étude sur les versions avancées de trois chatbots IA populaires révèle qu'ils ont tendance à générer des réponses incorrectes plus fréquemment qu'ils ne l'admettent lorsqu'ils ne savent pas quelque chose. La recherche, dirigée par José Hernández-Orallo de l'Institut de Recherche Valencien pour l'Intelligence Artificielle, a analysé les erreurs des grands modèles de langage (LLMs), notant que bien que l'exactitude s'améliore avec la taille et le raffinement du modèle, le taux de réponses incorrectes a également augmenté. Au lieu de choisir de décliner les questions difficiles, ces modèles fournissent souvent des réponses, ce qui entraîne une augmentation des réponses trompeuses. Hernández-Orallo observe que les chatbots deviennent plus habiles à imiter la connaissance sans comprendre réellement, un phénomène décrit comme 'ultracrépidarianisme'. Cela peut conduire les utilisateurs à surestimer les capacités des chatbots, ce qui présente des risques. L'équipe a examiné des modèles comme le GPT d'OpenAI, le LLaMA de Meta, et le BLOOM en open source, évaluant leur exactitude sur divers types de questions.

Ils ont constaté que même avec des modèles améliorés, plus de 60% de leurs réponses étaient incorrectes ou non qualifiées. De plus, les volontaires humains ont souvent mal classé les réponses incorrectes comme correctes, démontrant un manque de capacité à superviser les modèles efficacement. Pour améliorer la compréhension des utilisateurs, Hernández-Orallo suggère que les développeurs doivent améliorer les performances sur les questions simples et entraîner les chatbots à s'abstenir de répondre aux questions difficiles. Cela aiderait les utilisateurs à identifier où l'IA est fiable et où elle ne l'est pas. Bien que certains chatbots puissent reconnaître leur manque de connaissance, la poussée pour que les modèles s'attaquent aux questions difficiles reste forte, en particulier pour ceux commercialisés comme étant polyvalents.


Watch video about

Une étude révèle que les chatbots IA fournissent fréquemment des réponses incorrectes

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 16, 2025, 5:43 a.m.

Zeta Global (NYSE : ZETA) met en avant la suite m…

Zeta Global annonce une programmation exclusive pour le CES 2026, mettant en avant le marketing alimenté par l’IA et l’évolution d’Athena 15 décembre 2025 – LAS VEGAS – Zeta Global (NYSE : ZETA), le Cloud Marketing IA, a dévoilé ses plans pour le CES 2026, incluant une soirée après-work exclusive et une discussion enflammée dans sa suite Athena

Dec. 16, 2025, 5:22 a.m.

Les techniques de compression vidéo par intellige…

Dans le monde en constante évolution du divertissement numérique, les services de streaming adoptent de plus en plus des techniques de compression vidéo basées sur l'intelligence artificielle (IA) afin d'améliorer l'expérience utilisateur.

Dec. 16, 2025, 5:22 a.m.

On s’attend à ce que l’intelligence artificielle …

À l'arrivée de la saison des fêtes, l'IA émerge comme un assistant personnel d'achat populaire.

Dec. 16, 2025, 5:20 a.m.

Chicago Tribune poursuit Perplexity AI pour viola…

Le Chicago Tribune a intenté une action en justice contre Perplexity AI, un moteur de réponse basé sur l'intelligence artificielle, l'accusant d'utiliser de manière illégale le contenu journalistique du Tribune et de détourner le trafic web de ses plateformes.

Dec. 16, 2025, 5:17 a.m.

Meta confirme que les messages de groupe WhatsApp…

Meta a récemment clarifié sa position concernant l'utilisation des données des groupes WhatsApp pour la formation en intelligence artificielle (IA), répondant ainsi à la désinformation généralisée et aux préoccupations des utilisateurs.

Dec. 16, 2025, 5:17 a.m.

Le PDG d'AI SEO Newswire présenté dans le Daily S…

Marcus Morningstar, PDG d'AI SEO Newswire, a récemment été présenté sur le blog Daily Silicon Valley, où il évoque ses travaux pionniers dans un domaine qu’il qualifie d’Optimisation de Moteurs Génératifs (GEO).

Dec. 15, 2025, 1:26 p.m.

L'IA génère un record de 336,6 milliards de dolla…

L’analyse de Salesforce sur la période d’achats de la Cyber Week 2025 révèle des ventes mondiales records dans le secteur du commerce de détail s’élevant à 336,6 milliards de dollars, soit une augmentation de 7 % par rapport à l’année précédente.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today