Google DeepMind integriert das Gemini-KI-Modell in die Robotik.

Google DeepMind, ein Unternehmen für künstliche Intelligenz, hat eine Version seines fortschrittlichsten großen Sprachmodells (LLM) namens Gemini in Roboter integriert. Dieses Modell ermöglicht es Maschinen, verschiedene Aufgaben auszuführen – wie beispielsweise einen kleinen Basketball durch einen Desktop-Reifen zu „slam dunking“ –, ohne jemals einen anderen Roboter gesehen zu haben, der diese Aktion ausführt, so das Unternehmen. Das Unternehmen ist Teil einer breiteren Bewegung, die darauf abzielt, die Fortschritte in der KI, die Chatbots antreiben, zu nutzen, um Robotern für allgemeine Zwecke zu entwickeln. Dieser Ansatz wirft jedoch Sicherheitsbedenken auf, da solche Modelle ungenaue und schädliche Ergebnisse erzeugen können. Das Ziel ist es, Maschinen zu entwerfen, die einfach zu bedienen sind und in der Lage sind, eine Vielzahl physischer Aufgaben zu erfüllen, ohne menschliche Aufsicht oder Programmierung zu benötigen. Durch die Anbindung an Geminis Robotermodelle können Entwickler ihre Roboter verbessern, sodass diese „natürliche Sprache verstehen und die physische Welt viel detaillierter begreifen“ können, erklärt Carolina Parada, die das Google DeepMind-Robotikteam in Boulder, Colorado, leitet. Das als Gemini Robotics bezeichnete Modell, das am 12.
März durch einen Blog-Beitrag und ein technisches Papier vorgestellt wurde, wird als „ein kleiner, aber greifbarer Schritt“ zur Verwirklichung dieser Vision beschrieben, so Alexander Khazatsky, ein KI-Forscher und Mitbegründer von CollectedAI in Berkeley, Kalifornien, der sich auf die Erstellung von Datensätzen für KI-gesteuerte Roboter konzentriert. **Räumliches Bewusstsein** In London begann ein Team bei Google DeepMind mit Gemini 2. 0, dem fortschrittlichsten Modell für visuelle und sprachliche Aufgaben des Unternehmens, das durch die Analyse riesiger Datenmengen zur Mustererkennung trainiert wurde. Sie entwickelten eine spezialisierte Version des Modells, die auf Denkaufgaben abzielt, die ein 3D-physikalisches und räumliches Verständnis erfordern – wie das Vorhersagen der Flugbahn von Objekten oder das Erkennen desselben Teils eines Objekts in Bildern, die aus unterschiedlichen Winkeln aufgenommen wurden. Anschließend trainierten sie das Modell weiter mit Daten aus Tausenden von Stunden echten, fernbedienten Roboterdemonstrationen. Dies ermöglichte es dem robotischen „Gehirn“, tatsächliche Aktionen auszuführen, ähnlich wie LLMs nach gelernten Assoziationen die nächsten Worte generieren. Das Team bewertete Gemini Robotics an humanoiden Robotern und Roboterarmen und überprüfte sowohl trainierte Aufgaben als auch neuartige Aktivitäten. Laut ihren Erkenntnissen übertrafen Roboter, die das Modell nutzen, konstant führende Konkurrenten in Tests, die sowohl vertraute Aufgaben mit veränderten Details als auch ganz neue Herausforderungen umfassten. **Origami Falten**
Brief news summary
Google DeepMind hat erhebliche Fortschritte in der Robotik gemacht, indem es sein Gemini-Sprachmodell integriert hat, das es Robotern ermöglicht, autonom zu arbeiten, ohne dass vorherige Demonstrationen notwendig sind. Diese Entwicklung, die am 12. März angekündigt wurde, verbessert die Roboterfähigkeiten und ermöglicht es Maschinen, verschiedene Aufgaben auszuführen, wie zum Beispiel Slam Dunks mit Mini-Basketbällen. Das Hauptziel ist die Schaffung flexibler Roboter, die Aufgaben intuitiv mit minimaler menschlicher Aufsicht erledigen können. Diese Fortschritte werfen jedoch Bedenken hinsichtlich potenzieller Risiken im Zusammenhang mit KI auf, insbesondere bezüglich der Wahrscheinlichkeit, Fehler zu machen oder schädliche Entscheidungen zu treffen. Carolina Parada, die Leiterin des Robotik-Teams, betonte, dass das Gemini-Modell die Fähigkeit von Robotern, natürliche Sprache und ihre physischen Umgebungen zu verstehen, erheblich verbessert. Basierend auf dem Gemini 2.0-Framework wurde das Modell mit umfangreichen Datensätzen trainiert, um das Denken in dreidimensionalen Räumen zu verbessern, und mithilfe von Beispielen aus ferngesteuerten Robotern feinjustiert. Gemini übertrifft andere führende Robotermodelle sowohl in vertrauten als auch in neuen Aufgaben und positioniert sich damit, bedeutende Fortschritte in der intelligenten Robotik voranzutreiben und ihre Anwendungen zu erweitern – von einfachem Origami bis hin zu komplexen körperlichen Manövern.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!
Hot news

Warum spricht everyone über die SoundHound AI Akt…
Wesentliche Punkte SoundHound bietet eine unabhängige KI-Sprachplattform, die mehrere Branchen bedient, mit einem insgesamt adressierbaren Markt (TAM) von 140 Milliarden US-Dollar

Das TON-Ökosystem von Telegram: Ein Nutzer-Billio…
Der nächste Schritt in der Blockchain-Branche ist nicht nur technologische Innovation, sondern Massenakzeptanz, wobei das TON-Ökosystem von Telegram, betrieben durch The Open Platform (TOP), an vorderster Front steht.

16 Milliarden Passwörter geleakt. Ist es endlich …
Der 16-Milliarden-Passwort-Leak: Was tatsächlich passiert ist Im Juni 2025 enthüllten Cybersecurity-Forscher von Cybernews einen der größten credential-Leaks aller Zeiten: Über 16 Milliarden Login-Daten, verteilt auf etwa 30 riesige Datensätze, waren frei im Internet zugänglich

KI in der Fertigung: Optimierung der Produktionsp…
Künstliche Intelligenz (KI) verändert die Fertigungsindustrie grundlegend, indem sie Produktionsprozesse durch fortschrittliche Technologiekombinationen optimiert.

Unabhängige Verlage legen Kartellbeschwerde gegen…
Eine Koalition unabhängiger Verlage hat bei der Europäischen Kommission eine Kartellbeschwerde eingereicht und Google des Marktmissbrauchs durch die AI Overviews-Funktion beschuldigt.

Der Kongress erklärt Crypto-Woche: US-Gesetzgeber…
Wesentliche Erkenntnisse: Das US-Repräsentantenhaus wird in der Woche vom 14

Ilya Sutskever übernimmt die Führung bei sicherer…
Ilya Sutskever hat die Leitung von Safe Superintelligence (SSI) übernommen, dem KI-Startup, das er im Jahr 2024 gegründet hat.