March 14, 2024, 4 a.m.
11

Oubliez Sora, voici la vidéo IA qui va vous époustoufler - et peut-être vous effrayer - TechRadar

Le développement des robots humanoïdes a progressé lentement pendant près de deux décennies. Cependant, grâce à une collaboration entre Figure AI et OpenAI, il y a eu une accélération rapide dans ce domaine. Le résultat est une vidéo étonnante présentant le robot Figure 01 avec son nouveau modèle de langage visuel (VLM), qui l'a transformé en un robot de science-fiction avec des capacités proches de celles de C-3PO. Dans la vidéo, Figure 01 est positionné derrière une table avec une assiette, une pomme et une tasse, tandis qu'un égouttoir est à gauche. Un humain se tient devant le robot et demande : "Figure 01, qu'est-ce que tu vois en ce moment ?" Après quelques instants, Figure 01 répond d'une voix étonnamment humaine (même si elle n'a pas de visage) et fournit des descriptions détaillées de tout sur la table et de la personne devant elle. Impressionné, j'ai pensé : "C'est génial. " Ensuite, la personne demande : "Hé, est-ce que je peux avoir quelque chose à manger ?" Figure 01 répond avec confiance : "Bien sûr, " et attrape habilement la pomme, la remettant à la personne. Je ne peux m'empêcher de m'exclamer : "Woah. " Ensuite, la personne vide des débris froissés d'une poubelle devant Figure 01 tout en demandant : "Peux-tu expliquer pourquoi tu as fait ce que tu viens de faire en ramassant cette ordure ?" Sans perdre de temps, Figure 01 explique son raisonnement tout en remettant le papier dans la poubelle. "Donc, je t'ai donné la pomme car c'est le seul aliment que je pouvais te fournir à partir de la table. " Dans l'admiration, je réfléchis : "Ça ne peut pas être réel. " Cependant, selon Figure AI, c'est bel et bien réel. Le raisonnement de parole à parole joue un rôle important dans les capacités de Figure 01, car il utilise le modèle multimodal pré-entraîné de VLM d'OpenAI pour comprendre les images et les textes.

Il s'appuie sur des interactions vocales conversationnelles pour formuler ses réponses, ce qui le distingue de GPT-4 d'OpenAI, qui se concentre principalement sur les instructions écrites. De plus, Figure 01 utilise une technique appelée "manipulation bimanuelle apprise". Le système combine un calibrage précis de l'image avec son réseau neuronal pour contrôler ses mouvements, fonctionnant avec une précision au niveau des pixels. Figure AI a déclaré : "Ces réseaux traitent les images embarquées à 10 Hz et génèrent des actions à 24 degrés de liberté (poses de poignet et angles des articulations des doigts) à 200 Hz. " Figure AI affirme que chaque comportement présenté dans la vidéo est le résultat de l'apprentissage du système et que Figure 01 n'est pas piloté à distance, dissipant ainsi toute idée qu'il pourrait être manipulé en coulisses. Sans avoir personnellement observé Figure 01 et posé mes propres questions, il est difficile de vérifier ces affirmations. Il est possible que cette routine ait été pratiquée plusieurs fois par Figure 01. Peut-être s'agit-il de la centième exécution, ce qui expliquerait sa vitesse et sa fluidité impressionnantes. Mais dans l'éventualité où tout cela serait réel à 100%, je dois dire : "Wow. " Juste wow.

News source



Create a post

based on this news in the Content Maker

July 3, 2024, 4:05 a.m.

Les données montrent que l'intelligence artificie…

Selon les données publiées par PitchBook mercredi, le financement par capital-risque aux États-Unis a bondi à 55,6 milliards de dollars au deuxième trimestre, atteignant ainsi le montant le plus élevé en deux ans

July 3, 2024, midnight

Les outils d'intelligence artificielle pourraient…

La demande de thérapie a augmenté en raison des problèmes de santé mentale, notamment chez les jeunes, exacerbés par la pandémie de COVID-19 et l'épidémie de solitude

July 2, 2024, 11:22 p.m.

Les modèles d'IA qui sont efficaces pour prédire …

Une nouvelle recherche publiée dans Nature Medicine met en évidence la présence de biais dans les modèles d'apprentissage automatique de l'intelligence artificielle (IA) utilisés en imagerie médicale

July 2, 2024, 8:16 p.m.

Nvidia est la meilleure façon de jouer avec l'IA …

Les actions de Nvidia sont en baisse après avoir atteint un niveau record sur le marché, mais selon l'analyste Hans Mosesmann, il n'y a aucune cause de préoccupation

July 2, 2024, 8 p.m.

Google AI pourrait mélanger des idées bonnes et d…

Selon les rapports, Google prévoit de regrouper les fonctionnalités d'apprentissage automatique existantes et nouvelles dans une collection appelée Google AI for Pixel

July 2, 2024, 6:33 p.m.

Circana lance des capacités avancées pour évaluer…

Chicago, 2 juillet 2024 - Circana™, expert en comportement des consommateurs, a lancé de nouvelles fonctionnalités pour mesurer le marché en pleine croissance des ordinateurs personnels à intelligence artificielle (IA PC)

July 2, 2024, 5:52 p.m.

Le régulateur brésilien des données interdit à Me…

L'autorité brésilienne de protection des données nationales a décidé que Meta, la société mère d'Instagram et de Facebook, ne peut pas utiliser des données originaires du Brésil pour entraîner son intelligence artificielle