lang icon En
March 13, 2024, 8 p.m.
2517

None

Brief news summary

None

Le développement des robots humanoïdes a progressé lentement pendant près de deux décennies. Cependant, grâce à une collaboration entre Figure AI et OpenAI, il y a eu une accélération rapide dans ce domaine. Le résultat est une vidéo étonnante présentant le robot Figure 01 avec son nouveau modèle de langage visuel (VLM), qui l'a transformé en un robot de science-fiction avec des capacités proches de celles de C-3PO. Dans la vidéo, Figure 01 est positionné derrière une table avec une assiette, une pomme et une tasse, tandis qu'un égouttoir est à gauche. Un humain se tient devant le robot et demande : "Figure 01, qu'est-ce que tu vois en ce moment ?" Après quelques instants, Figure 01 répond d'une voix étonnamment humaine (même si elle n'a pas de visage) et fournit des descriptions détaillées de tout sur la table et de la personne devant elle. Impressionné, j'ai pensé : "C'est génial. " Ensuite, la personne demande : "Hé, est-ce que je peux avoir quelque chose à manger ?" Figure 01 répond avec confiance : "Bien sûr, " et attrape habilement la pomme, la remettant à la personne. Je ne peux m'empêcher de m'exclamer : "Woah. " Ensuite, la personne vide des débris froissés d'une poubelle devant Figure 01 tout en demandant : "Peux-tu expliquer pourquoi tu as fait ce que tu viens de faire en ramassant cette ordure ?" Sans perdre de temps, Figure 01 explique son raisonnement tout en remettant le papier dans la poubelle. "Donc, je t'ai donné la pomme car c'est le seul aliment que je pouvais te fournir à partir de la table. " Dans l'admiration, je réfléchis : "Ça ne peut pas être réel. " Cependant, selon Figure AI, c'est bel et bien réel. Le raisonnement de parole à parole joue un rôle important dans les capacités de Figure 01, car il utilise le modèle multimodal pré-entraîné de VLM d'OpenAI pour comprendre les images et les textes.

Il s'appuie sur des interactions vocales conversationnelles pour formuler ses réponses, ce qui le distingue de GPT-4 d'OpenAI, qui se concentre principalement sur les instructions écrites. De plus, Figure 01 utilise une technique appelée "manipulation bimanuelle apprise". Le système combine un calibrage précis de l'image avec son réseau neuronal pour contrôler ses mouvements, fonctionnant avec une précision au niveau des pixels. Figure AI a déclaré : "Ces réseaux traitent les images embarquées à 10 Hz et génèrent des actions à 24 degrés de liberté (poses de poignet et angles des articulations des doigts) à 200 Hz. " Figure AI affirme que chaque comportement présenté dans la vidéo est le résultat de l'apprentissage du système et que Figure 01 n'est pas piloté à distance, dissipant ainsi toute idée qu'il pourrait être manipulé en coulisses. Sans avoir personnellement observé Figure 01 et posé mes propres questions, il est difficile de vérifier ces affirmations. Il est possible que cette routine ait été pratiquée plusieurs fois par Figure 01. Peut-être s'agit-il de la centième exécution, ce qui expliquerait sa vitesse et sa fluidité impressionnantes. Mais dans l'éventualité où tout cela serait réel à 100%, je dois dire : "Wow. " Juste wow.


Watch video about

None

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Jan. 11, 2026, 1:39 p.m.

La vidéo IARévolutionne le marché moyen du market…

Le paysage de la création vidéo connaît une transformation spectaculaire, portée par l’accélération de la technologie IA et la chute des coûts, qui reshaping l’économie créative.

Jan. 11, 2026, 1:32 p.m.

Ministre du SASAC : Les entreprises publiques ren…

Zhang Yu Zhuo, ministre de la Commission de supervision et d'administration des actifs détenus par l'État du Conseil d'État, a récemment exposé les priorités stratégiques des entreprises publiques centrales (EPC) pour la période du 16e plan quinquennal.

Jan. 11, 2026, 1:27 p.m.

GPT-5 d'OpenAI : une avancée dans les modèles lin…

OpenAI, une organisation de recherche en IA de premier plan, a officiellement lancé GPT-5, le dernier modèle avancé de traitement du langage naturel, marqué par une avancée majeure dans ce domaine.

Jan. 11, 2026, 1:16 p.m.

Google annonce le protocole de paiement en mode I…

Google a lancé de nouveaux outils permettant aux acheteurs d'effectuer directement leurs achats dans le Mode IA et d'interagir avec des agents IA de marque dans les résultats de recherche.

Jan. 11, 2026, 1:14 p.m.

L'IA transforme les processus de vente grâce au «…

L'intelligence artificielle (IA) transforme rapidement la manière dont les entreprises gèrent leurs ventes, en introduisant un concept innovant appelé « vente basée sur l'ambiance » ou « vente vibe ».

Jan. 11, 2026, 1:12 p.m.

Les limites de l'IA, l'intégration des médias, le…

En décembre, l'industrie de la publicité a perdu 2 800 emplois, tandis que l'emploi total aux États-Unis a augmenté modestement de 50 000 postes.

Jan. 11, 2026, 9:40 a.m.

Les techniques de compression vidéo par intellige…

Les progrès des technologies de compression vidéo basées sur l'intelligence artificielle transforment la manière dont le contenu vidéo est diffusé en ligne.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today