lang icon En
Oct. 23, 2024, 7 a.m.
1388

SynthID de Google DeepMind : Outil d'identification du texte AI open-source

Brief news summary

Google DeepMind a lancé SynthID, un outil open source conçu pour identifier le texte généré par l'IA, dans le cadre d'une suite plus large de solutions de filigrane pour l'IA générative, qui comprend des outils pour les images et les vidéos. SynthID est intégré à l'application Gemini de Google et est disponible sur Hugging Face, fournissant un moyen de distinguer le contenu généré par l'IA du texte écrit par des humains, aidant ainsi à lutter contre la désinformation. L'outil utilise une méthode de filigrane invisible qui ajuste subtilement les probabilités de token lors de la génération de texte, maintenant la qualité et la créativité du texte produit. Les recherches indiquent que les utilisateurs ont souvent du mal à différencier le texte avec et sans filigrane. Cependant, l'efficacité de SynthID peut être réduite si le texte généré est modifié ou traduit par la suite. En rendant SynthID open source, les développeurs peuvent adopter ses techniques dans leurs propres modèles d'IA, promouvant des pratiques responsables de l'IA. Les experts soulignent que, bien que le filigrane augmente la sécurité du contenu, il doit être utilisé en parallèle avec la vérification des faits et d'autres techniques de vérification pour garantir l'exactitude et la fiabilité du matériel généré par l'IA.

Google DeepMind a créé un outil open source conçu pour identifier le texte généré par l'IA, appelé SynthID. SynthID fait partie d'une gamme plus large d'outils de filigrane destinés aux productions de l'IA générative. Après l'introduction d'un filigrane pour les images l'année dernière, l'entreprise a ensuite sorti un pour les vidéos générées par l'IA. En mai, Google a révélé que SynthID est en cours d'intégration dans son application Gemini et les chatbots en ligne et rendu accessible gratuitement sur Hugging Face, un référentiel bien connu de jeux de données et de modèles d'IA. Les filigranes deviennent cruciaux pour aider les utilisateurs à reconnaître le contenu généré par l'IA, ce qui est essentiel pour lutter contre des problèmes tels que la désinformation. Pushmeet Kohli, vice-président de la recherche chez Google DeepMind, déclare : « Maintenant, d'autres développeurs d'IA [générative] peuvent utiliser cette technologie pour distinguer si les résultats textuels proviennent de leurs propres [grands modèles linguistiques], facilitant ainsi le développement responsable de l'IA dans l'ensemble. » SynthID intègre un filigrane invisible directement dans le texte lors du processus de génération par un modèle d'IA. Les grands modèles de langage fonctionnent en décomposant le langage en « tokens » et en prédisant le token le plus probable à suivre. Ces tokens peuvent inclure des caractères simples, des mots ou des portions de phrases, chacun étant affecté d'un score de probabilité reflétant sa probabilité d'être le mot suivant dans une phrase. Des probabilités plus élevées suggèrent une chance accrue de sélection par le modèle. Kohli explique que SynthID introduit des informations supplémentaires au stade de la génération en ajustant la probabilité de génération de tokens. Pour discerner le filigrane, SynthID examine les scores de probabilité attendus des mots dans les textes avec et sans filigrane. Selon Google DeepMind, l'utilisation de SynthID n'a pas compromis la qualité, l'exactitude, la créativité ou la vitesse du texte généré. Cette conclusion a résulté d'une expérience en direct approfondie évaluant la performance de SynthID après le déploiement du filigrane dans les produits Gemini, que des millions d'utilisateurs ont utilisés.

Gemini permet aux utilisateurs d'évaluer les réponses du modèle IA à l'aide d'indicateurs de pouces levés ou baissés. Kohli et son équipe ont évalué les données provenant d'environ 20 millions de réponses des chatbots avec et sans filigrane, ne découvrant aucune différence perçue en qualité ou utilité. Les résultats de cette expérience sont détaillés dans un article publié aujourd'hui dans Nature. Actuellement, SynthID pour le texte est exclusif aux modèles de Google, mais l'intention derrière l'open-sourcing est d'élargir sa compatibilité avec plus d'outils. Malgré ses avantages, SynthID a des limites. Le filigrane peut résister à certaines méthodes de falsification, telles que la légère édition ou le recadrage, mais est moins efficace lorsque le texte généré par l'IA est réécrit ou traduit dans d'autres langues. Il rencontre également des défis lorsqu'il répond à des invites factuelles, comme identifier la capitale de la France, en raison d'opportunités limitées pour ajuster la probabilité des mots à venir sans altérer les informations factuelles. João Gante, ingénieur en apprentissage automatique chez Hugging Face, souligne un autre avantage de l'open-sourcing de l'outil : il permet à quiconque d'accéder et d'intégrer le filigrane dans son modèle librement. Gante estime que cela améliorera la confidentialité du filigrane car seulement le propriétaire détiendra ses secrets cryptographiques. « Avec l'amélioration de l'accessibilité et la validation de ses fonctionnalités, j'espère que le filigrane deviendra une pratique standard, aidant à la détection de l'utilisation malveillante du modèle linguistique », déclare Gante. Cependant, Irene Solaiman, responsable de la politique mondiale chez Hugging Face, met en garde contre le fait que les filigranes ne sont pas une solution complète. « Le filigrane représente juste un aspect des modèles plus sûrs au sein d'un écosystème nécessitant une diversité de garde-fous complémentaires. De même, la vérification des faits pour le contenu généré par l'homme peut avoir différents niveaux d'efficacité », explique-t-elle.


Watch video about

SynthID de Google DeepMind : Outil d'identification du texte AI open-source

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 16, 2025, 1:29 p.m.

Application SaaStr AI de la semaine : Kintsugi — …

Chaque semaine, nous mettons en lumière une application basée sur l'IA qui résout de véritables problèmes pour les entreprises B2B et Cloud.

Dec. 16, 2025, 1:24 p.m.

Le rôle de l'intelligence artificielle dans les s…

L'intelligence artificielle (IA) influence de plus en plus les stratégies de référencement local (SEO).

Dec. 16, 2025, 1:22 p.m.

IND Technology obtient 33 millions de dollars pou…

IND Technology, une société australienne spécialisée dans la surveillance des infrastructures pour les services publics, a obtenu 33 millions de dollars en financement de croissance afin de renforcer ses efforts basés sur l'intelligence artificielle pour prévenir les incendies de forêt et les coupures de courant.

Dec. 16, 2025, 1:21 p.m.

Le déploiement de l'IA devient compliqué pour les…

Au cours des dernières semaines, un nombre croissant d'éditeurs et de marques ont fait face à une opposition significative alors qu'ils expérimentent avec l'intelligence artificielle (IA) dans leurs processus de production de contenu.

Dec. 16, 2025, 1:17 p.m.

Google Labs et DeepMind lancent Pomelli : un outi…

Google Labs, en partenariat avec Google DeepMind, a lancé Pomelli, une expérience basée sur l’intelligence artificielle conçue pour aider les petites et moyennes entreprises à développer des campagnes marketing cohérentes avec leur marque.

Dec. 16, 2025, 1:15 p.m.

La reconnaissance vidéo par intelligence artifici…

Dans l’environnement numérique en rapide expansion d’aujourd’hui, les entreprises de médias sociaux adoptent de plus en plus des technologies avancées pour protéger leurs communautés en ligne.

Dec. 16, 2025, 9:37 a.m.

Pourquoi 2026 pourrait être l'année du marketing …

Une version de cette histoire est parue dans la newsletter Nightcap de CNN Business.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today