lang icon English
March 13, 2024, 8 p.m.
1978

None

Die Entwicklung humanoider Roboter hat sich in den letzten knapp zwei Jahrzehnten langsam fortgesetzt. Dank einer Zusammenarbeit zwischen Figure AI und OpenAI gibt es jedoch eine rasche Beschleunigung auf diesem Gebiet. Das Ergebnis ist ein erstaunliches Video, das den Roboter Figure 01 mit seinem neuen Visual Language Model (VLM) zeigt, das ihn in einen futuristischen Bot verwandelt hat mit Fähigkeiten, die denen von C-3PO nahekommen. Im Video steht Figure 01 hinter einem Tisch mit einem Teller, einem Apfel und einer Tasse, während sich links ein Abtropfer befindet. Ein Mensch steht vor dem Roboter und fragt: "Figure 01, was siehst du gerade?" Nach einigen Momenten antwortet Figure 01 mit einer bemerkenswert menschenähnlichen Stimme (obwohl es kein Gesicht hat) und liefert ausführliche Beschreibungen von allem auf dem Tisch und der Person davor. Beeindruckt dachte ich: "Das ist cool. " Dann fragt die Person: "Hey, kann ich etwas zu essen haben?" Figure 01 antwortet selbstbewusst: "Natürlich" und nimmt geschickt den Apfel auf und reicht ihn der Person. Ich konnte nicht anders als "Wow" auszurufen. Als nächstes leert die Person einige zerknitterte Abfälle aus einem Behälter vor Figure 01 und fragt: "Kannst du erklären, warum du gerade diesen Müll aufgegriffen hast?" Ohne Zeit zu verlieren, erklärt Figure 01 seine Gedanken, während es das Papier zurück in den Behälter legt. "Also, ich habe dir den Apfel gegeben, weil er das einzige essbare Element war, das ich dir vom Tisch geben konnte. " Voller Bewunderung überlegte ich: "Das kann doch nicht echt sein. " Laut Figure AI ist es jedoch tatsächlich echt. Sprach-zu-Sprach-Argumentation spielt eine bedeutende Rolle bei den Fähigkeiten von Figure 01, da es OpenAI's vortrainiertes multimodales Modell VLM nutzt, um Bilder und Texte zu verstehen. Es basiert auf stimmbasierten Gesprächsinteraktionen, um seine Antworten zu formulieren und hebt sich damit von OpenAI's GPT-4 ab, das sich hauptsächlich auf schriftliche Anweisungen konzentriert. Darüber hinaus setzt Figure 01 eine Technik namens "erlernte manipulative Bimanipulation auf niedriger Ebene" ein.

Das System kombiniert präzise Bildkalibrierung mit seinem neuronalen Netzwerk, um seine Bewegungen zu steuern und arbeitet dabei mit einer Genauigkeit im Pixelbereich. Figure AI erklärte: "Diese Netzwerke verarbeiten an Bord aufgenommene Bilder mit einer Frequenz von 10 Hz und erzeugen 24 DOF-Aktionen (Handgelenkpositionen und Fingerwinkel) mit einer Frequenz von 200 Hz. " Figure AI behauptet, dass jedes Verhalten im Video das Ergebnis des Systemlernens ist und dass Figure 01 nicht per Fernbedienung gesteuert wird, was jegliche Vorstellungen einer ferngesteuerten Puppenspielerei ausschließt. Ohne Figure 01 persönlich zu erleben und meine eigenen Fragen zu stellen, ist es schwierig, diese Behauptungen zu überprüfen. Es besteht die Möglichkeit, dass diese Routine von Figure 01 mehrfach geübt wurde. Vielleicht ist dies der hundertste Durchlauf, was seine beeindruckende Geschwindigkeit und Flüssigkeit erklärt. Aber für den Fall, dass dies tatsächlich zu 100% echt ist, muss ich sagen "Wow". Einfach wow.



Brief news summary

None

Watch video about

None

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Oct. 11, 2025, 2:15 p.m.

KI zerstört SEO. Ranglistenplätzierungen erforder…

KI-Antwortmaschinen verändern nicht nur, wie Menschen online suchen; sie definieren die Sichtbarkeit von Unternehmen im digitalen Zeitalter grundlegend neu.

Oct. 11, 2025, 2:14 p.m.

Diese hyperrealistischen Videos, die du siehst, k…

In einem Kurzvideo reagiert ein Influencer leidenschaftlich auf eine Nachricht aus Kalifornien, die scheinbar authentische Aufnahmen zeigt, darunter ein Nachrichtensprecher, der die Zuschauer zum Handeln auffordert, Opfer sowie ein CNN-Logo.

Oct. 11, 2025, 2:13 p.m.

„Vorantreibung des gesamten KI-Ökosystems“ – AMD …

AMD und OpenAI haben eine bahnbrechende Partnerschaft vorgestellt, die die KI-Infrastruktur grundlegend verändern soll.

Oct. 11, 2025, 2:09 p.m.

GM öffnet die Motorhaube für ihre KI-Marketingtra…

Molly Peck, die damals Chief Marketing Officer (CMO) von Buick und GMC war, hatte kürzlich die Position der Chief Transformation Officer übernommen, mit der Verantwortung, die Content-Strategie und die Agenturpartnerschaften von GM grundlegend zu überarbeiten.

Oct. 11, 2025, 10:26 a.m.

Was ist los mit den angeblichen Taylor Swift KI-V…

Wie bei jedem Albumstart von Taylor Swift wurden alle Elemente für The Life of a Showgirl sorgfältig geplant und umgesetzt, angefangen bei Teaser-Trailern bis hin zu Veranstaltungstagen und Talkshow-Auftritten.

Oct. 11, 2025, 10:21 a.m.

Google's KI-Modus-Suche wird auf neue Sprachen au…

Google hat eine umfangreiche Erweiterung seiner KI-gestützten Suchfunktion „AI Mode“ angekündigt, die nun fünf zusätzliche Sprachen unterstützt: Hindi, Indonesisch, Japanisch, Koreanisch und Brasilianisches Portugiesisch.

Oct. 11, 2025, 10:14 a.m.

Vxceed erstellt das perfekte Verkaufsgespräch für…

Dieser Beitrag, gemeinsam verfasst mit Cyril Ovely von Vxceed, behandelt eine dringende Herausforderung für Unternehmen der Konsumgüterbranche (CPG) in Schwellenländern: die effektive Bindung von Umsätzen und den Aufbau von Kundenloyalität in großem Maßstab.

All news

AI team for your Business

Automate Marketing, Sales, SMM & SEO

and get clients on autopilot — from social media and search engines. No ads needed

and get clients today