Google DeepMind intègre le modèle d'IA Gemini dans la robotique.

Google DeepMind, une entreprise d'intelligence artificielle, a intégré une version de son modèle de langage de grande capacité (LLM) le plus avancé, appelé Gemini, dans des robots. Ce modèle permet aux machines d'exécuter diverses tâches — comme "accrocher" un petit basketball à travers un cerceau de bureau — sans avoir jamais observé un autre robot réaliser l'action, selon l'entreprise. La société fait partie d'un mouvement plus large visant à tirer parti des avancées de l'IA qui alimentent les chatbots pour développer des robots polyvalents. Cependant, cette approche soulève des préoccupations en matière de sécurité en raison du potentiel de ces modèles à générer des résultats inexactes et nuisibles. L'objectif est de concevoir des machines faciles à utiliser et capables d'effectuer une variété de tâches physiques sans avoir besoin d'une supervision humaine ou d'une programmation préalable.
En se connectant aux modèles robotiques de Gemini, les développeurs peuvent améliorer leurs robots, leur permettant de comprendre “le langage naturel et de percevoir le monde physique avec beaucoup plus de détails, ” explique Carolina Parada, responsable de l'équipe de robotique de Google DeepMind basée à Boulder, Colorado. Le modèle appelé Gemini Robotics, qui a été dévoilé le 12 mars par le biais d'un article de blog et d'un document technique, est décrit comme “un petit mais tangible pas” vers la réalisation de cette vision, selon Alexander Khazatsky, un chercheur en IA et cofondateur de CollectedAI à Berkeley, Californie, axé sur la création de jeux de données pour des robots alimentés par l'IA. **Conscience Spatiale** Basée à Londres, une équipe de Google DeepMind a commencé avec Gemini 2. 0, le modèle de vision et de langage le plus sophistiqué de l'entreprise, qui a été formé en analysant d'énormes quantités de données pour la reconnaissance de motifs. Ils ont développé une version spécialisée du modèle adaptée aux tâches de raisonnement nécessitant une compréhension physique et spatiale en 3D — comme prédire la trajectoire des objets ou reconnaître la même partie d'un objet dans des images capturées sous différents angles. Par la suite, ils ont encore entraîné le modèle en utilisant des données provenant de milliers d'heures de démonstrations de robots réels, télécommandés. Cela a permis au 'cerveau' robotique d'effectuer de réelles actions, parallèle à la manière dont les LLM génèrent des mots suivants en fonction des associations apprises. L'équipe a évalué Gemini Robotics sur des robots humanoïdes et des bras robotiques, en évaluant à la fois des tâches entraînées et des activités nouvelles. Selon leurs résultats, les robots utilisant le modèle ont systématiquement surpassé les principaux concurrents dans des tests impliquant à la fois des tâches familières avec des détails modifiés et des défis entièrement nouveaux. **Pliage d'Origami**
Brief news summary
Google DeepMind a réalisé des avancées significatives en robotique en intégrant son modèle de langage Gemini, qui permet aux robots de fonctionner de manière autonome sans avoir besoin de démonstrations préalables. Annoncé le 12 mars, ce développement améliore les capacités robotiques, permettant aux machines d'effectuer diverses tâches, comme réaliser des dunks avec des mini-balles de basket. L'objectif principal est de créer des robots flexibles capables de gérer intuitivement des tâches avec un minimum de supervision humaine. Cependant, cette avancée suscite des inquiétudes quant aux risques potentiels associés à l'IA, en particulier la probabilité de commettre des erreurs ou de faire des choix nuisibles. Carolina Parada, responsable de l'équipe de robotique, a souligné que le modèle Gemini améliore considérablement la capacité des robots à comprendre le langage naturel et leur environnement physique. Bâti sur le cadre de Gemini 2.0, le modèle a été formé sur de vastes ensembles de données pour améliorer le raisonnement dans des espaces tridimensionnels et a été affiné à l'aide d'exemples de robots télécommandés. Gemini surpasse d'autres modèles robotiques de premier plan dans des tâches familières et nouvelles, le positionnant pour entraîner des avancées substantielles dans la robotique intelligente et élargir ses applications, allant de l'origami simple à des manœuvres physiques complexes.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

La Nouvelle-Orléans envisage de mettre en place u…
La Nouvelle-Orléans s’apprête à devenir la première grande ville américaine à mettre en place un réseau de surveillance par reconnaissance faciale en direct, enrichi par l’intelligence artificielle, marquant ainsi une évolution majeure dans l’utilisation par les forces de l’ordre urbaines de technologies avancées pour la sécurité publique.

Ripple lance des paiements transfrontaliers en bl…
Ripple, le créateur de la cryptomonnaie XRP (XRP), a lancé des paiements transfrontaliers en blockchain aux Émirats arabes unis (EAU), une initiative qui pourrait accélérer l’adoption des cryptomonnaies dans un pays ouvert aux actifs numériques.

L'IA dans les véhicules autonomes : naviguer vers…
L'intelligence artificielle (IA) est devenue une technologie fondamentale qui stimule le progrès des véhicules autonomes, transformant en profondeur leur fonctionnement sur la route.

Toobit renforce sa présence en Europe en tant que…
GEORGE TOWN, Îles Caïmans, le 19 mai 2025 (GLOBE NEWSWIRE) – Toobit, une plateforme d’échange de dérivés cryptographiques primée, participera en tant que Sponsor Platiné lors de la Dutch Blockchain Week 2025 (DBW25) du 19 au 25 mai.

L'IA ne connaît pas le mot "non" – et c'est un pr…
Les tout-petits peuvent rapidement comprendre la signification du mot « non », mais de nombreux modèles d’intelligence artificielle rencontrent cette difficulté.

Finance du commerce numérique : Le rôle de la blo…
L’écosystème mondial du financement du commerce a traditionnellement souffert d’inefficiences, d’exposition au risque et de retards dus à une paperasserie manuelle, à des systèmes cloisonnés et à des processus opaque.

Les procureurs généraux abordent les défis réglem…
Compte tenu de l'évolution rapide et de l'adoption généralisée des technologies d'intelligence artificielle, les procureurs généraux des États-Unis interviennent activement pour réguler l'utilisation de l'IA en appliquant les cadres juridiques existants.