Google DeepMind a créé un outil open source conçu pour identifier le texte généré par l'IA, appelé SynthID. SynthID fait partie d'une gamme plus large d'outils de filigrane destinés aux productions de l'IA générative. Après l'introduction d'un filigrane pour les images l'année dernière, l'entreprise a ensuite sorti un pour les vidéos générées par l'IA. En mai, Google a révélé que SynthID est en cours d'intégration dans son application Gemini et les chatbots en ligne et rendu accessible gratuitement sur Hugging Face, un référentiel bien connu de jeux de données et de modèles d'IA. Les filigranes deviennent cruciaux pour aider les utilisateurs à reconnaître le contenu généré par l'IA, ce qui est essentiel pour lutter contre des problèmes tels que la désinformation. Pushmeet Kohli, vice-président de la recherche chez Google DeepMind, déclare : « Maintenant, d'autres développeurs d'IA [générative] peuvent utiliser cette technologie pour distinguer si les résultats textuels proviennent de leurs propres [grands modèles linguistiques], facilitant ainsi le développement responsable de l'IA dans l'ensemble. » SynthID intègre un filigrane invisible directement dans le texte lors du processus de génération par un modèle d'IA. Les grands modèles de langage fonctionnent en décomposant le langage en « tokens » et en prédisant le token le plus probable à suivre. Ces tokens peuvent inclure des caractères simples, des mots ou des portions de phrases, chacun étant affecté d'un score de probabilité reflétant sa probabilité d'être le mot suivant dans une phrase. Des probabilités plus élevées suggèrent une chance accrue de sélection par le modèle. Kohli explique que SynthID introduit des informations supplémentaires au stade de la génération en ajustant la probabilité de génération de tokens. Pour discerner le filigrane, SynthID examine les scores de probabilité attendus des mots dans les textes avec et sans filigrane. Selon Google DeepMind, l'utilisation de SynthID n'a pas compromis la qualité, l'exactitude, la créativité ou la vitesse du texte généré. Cette conclusion a résulté d'une expérience en direct approfondie évaluant la performance de SynthID après le déploiement du filigrane dans les produits Gemini, que des millions d'utilisateurs ont utilisés.
Gemini permet aux utilisateurs d'évaluer les réponses du modèle IA à l'aide d'indicateurs de pouces levés ou baissés. Kohli et son équipe ont évalué les données provenant d'environ 20 millions de réponses des chatbots avec et sans filigrane, ne découvrant aucune différence perçue en qualité ou utilité. Les résultats de cette expérience sont détaillés dans un article publié aujourd'hui dans Nature. Actuellement, SynthID pour le texte est exclusif aux modèles de Google, mais l'intention derrière l'open-sourcing est d'élargir sa compatibilité avec plus d'outils. Malgré ses avantages, SynthID a des limites. Le filigrane peut résister à certaines méthodes de falsification, telles que la légère édition ou le recadrage, mais est moins efficace lorsque le texte généré par l'IA est réécrit ou traduit dans d'autres langues. Il rencontre également des défis lorsqu'il répond à des invites factuelles, comme identifier la capitale de la France, en raison d'opportunités limitées pour ajuster la probabilité des mots à venir sans altérer les informations factuelles. João Gante, ingénieur en apprentissage automatique chez Hugging Face, souligne un autre avantage de l'open-sourcing de l'outil : il permet à quiconque d'accéder et d'intégrer le filigrane dans son modèle librement. Gante estime que cela améliorera la confidentialité du filigrane car seulement le propriétaire détiendra ses secrets cryptographiques. « Avec l'amélioration de l'accessibilité et la validation de ses fonctionnalités, j'espère que le filigrane deviendra une pratique standard, aidant à la détection de l'utilisation malveillante du modèle linguistique », déclare Gante. Cependant, Irene Solaiman, responsable de la politique mondiale chez Hugging Face, met en garde contre le fait que les filigranes ne sont pas une solution complète. « Le filigrane représente juste un aspect des modèles plus sûrs au sein d'un écosystème nécessitant une diversité de garde-fous complémentaires. De même, la vérification des faits pour le contenu généré par l'homme peut avoir différents niveaux d'efficacité », explique-t-elle.
SynthID de Google DeepMind : Outil d'identification du texte AI open-source
Chaque semaine, nous mettons en lumière une application basée sur l'IA qui résout de véritables problèmes pour les entreprises B2B et Cloud.
L'intelligence artificielle (IA) influence de plus en plus les stratégies de référencement local (SEO).
IND Technology, une société australienne spécialisée dans la surveillance des infrastructures pour les services publics, a obtenu 33 millions de dollars en financement de croissance afin de renforcer ses efforts basés sur l'intelligence artificielle pour prévenir les incendies de forêt et les coupures de courant.
Au cours des dernières semaines, un nombre croissant d'éditeurs et de marques ont fait face à une opposition significative alors qu'ils expérimentent avec l'intelligence artificielle (IA) dans leurs processus de production de contenu.
Google Labs, en partenariat avec Google DeepMind, a lancé Pomelli, une expérience basée sur l’intelligence artificielle conçue pour aider les petites et moyennes entreprises à développer des campagnes marketing cohérentes avec leur marque.
Dans l’environnement numérique en rapide expansion d’aujourd’hui, les entreprises de médias sociaux adoptent de plus en plus des technologies avancées pour protéger leurs communautés en ligne.
Une version de cette histoire est parue dans la newsletter Nightcap de CNN Business.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today