lang icon English
March 13, 2024, 8 p.m.
1981

None

O desenvolvimento de robôs humanoides tem progredido lentamente há quase duas décadas. No entanto, graças a uma colaboração entre Figure AI e OpenAI, houve uma aceleração rápida nesse campo. O resultado é um vídeo impressionante que apresenta o robô Figure 01 com seu novo Modelo de Linguagem Visual (VLM), que o transformou em um robô de ficção científica com capacidades próximas às de C-3PO. No vídeo, o Figure 01 está posicionado atrás de uma mesa com um prato, uma maçã e uma xícara, enquanto um escorredor está à esquerda. Uma pessoa fica em frente ao robô e pergunta: "Figure 01, o que você está vendo agora?" Após alguns momentos, o Figure 01 responde com uma voz surpreendentemente semelhante à humana (apesar de não ter um rosto) e fornece descrições detalhadas de tudo na mesa e da pessoa em frente a ela. Impressionado, penso: "Isso é legal. " Em seguida, a pessoa pergunta: "Ei, posso comer alguma coisa?" O Figure 01 responde confiantemente: "Claro", e habilmente pega a maçã, entregando-a à pessoa. Não pude deixar de exclamar: "Uau. " Em seguida, a pessoa despeja alguns detritos amassados de uma lixeira na frente do Figure 01 enquanto pergunta: "Você pode explicar por que você fez o que acabou de fazer enquanto pega esse lixo?" Sem perder tempo, o Figure 01 explica seu raciocínio enquanto coloca o papel de volta na lixeira. "Então, eu te dei a maçã porque é o único item comestível que eu poderia fornecer da mesa. " Maravilhado, penso: "Isso não pode ser real. " No entanto, de acordo com a Figure AI, é realmente real. O raciocínio de fala para fala desempenha um papel significativo nas habilidades do Figure 01, pois ele utiliza o modelo multimodal pré-treinado da OpenAI, o VLM, para compreender imagens e textos. Ele depende de interações de voz em conversação para formular suas respostas, diferenciando-o do GPT-4 da OpenAI, que se concentra principalmente em estímulos escritos. Além disso, o Figure 01 emprega uma técnica chamada "manipulação bimanual de baixo nível aprendida".

O sistema combina calibração precisa da imagem com sua rede neural para controlar seus movimentos, operando com uma precisão ao nível dos pixels. A Figure AI afirmou: "Essas redes processam imagens internas a 10hz e geram ações de 24 graus de liberdade (poses do pulso e ângulos das articulações dos dedos) a 200hz". A Figure AI afirma que todo comportamento exibido no vídeo é resultado do aprendizado do sistema e que o Figure 01 não é controlado por controle remoto, dissipando quaisquer noções de que ele seja manipulado nos bastidores. Sem testemunhar pessoalmente o Figure 01 e fazer minhas próprias perguntas, é difícil verificar essas afirmações. Existe a possibilidade de essa rotina ter sido praticada várias vezes pelo Figure 01. Talvez esta seja a centésima vez, o que explica sua velocidade e fluidez impressionantes. Mas, caso isso seja realmente 100% real, devo dizer: "Uau". Só wow.



Brief news summary

None

Watch video about

None

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Oct. 11, 2025, 2:15 p.m.

A IA Está Destruindo o SEO. Classificar Agora Req…

Engines de respostas de IA não estão apenas mudando a forma como as pessoas pesquisam online; elas estão redefinindo fundamentalmente a visibilidade dos negócios na era digital.

Oct. 11, 2025, 2:14 p.m.

Aqueles vídeos hiper-realistas que você está vend…

Em um vídeo de formato curto, uma influencer reage com paixão a uma notícia da Califórnia apresentando visuais aparentemente autênticos, incluindo um âncora incentivando os espectadores a agir, vítimas e o logo da CNN.

Oct. 11, 2025, 2:13 p.m.

Avançando todo o ecossistema de IA — AMD e OpenAI…

AMD e OpenAI anunciaram uma parceria histórica que promete transformar profundamente a infraestrutura de IA.

Oct. 11, 2025, 2:09 p.m.

GM revela sua transformação em marketing de intel…

Molly Peck, que na época era a diretora de marketing (CMO) da Buick e GMC, havia recentemente assumido o cargo de diretora de transformação, com a responsabilidade de reformular a estratégia de conteúdo da GM e suas parcerias com agências.

Oct. 11, 2025, 10:26 a.m.

O que está acontecendo com os supostos vídeos de …

Assim como em todo lançamento de álbum da Taylor Swift, todos os elementos de The Life of a Showgirl foram cuidadosamente planejados e implementados desde a semana passada, desde trailers teaser até eventos no dia do lançamento e aparições em programas de televisão.

Oct. 11, 2025, 10:21 a.m.

O Modo de Pesquisa de IA do Google expande-se par…

A Google anunciou uma grande expansão de seu recurso de busca alimentado por IA, o 'Modo AI', agora suportando cinco novos idiomas: Hindi, Indonésio, Japonês, Coreano e Português do Brasil.

Oct. 11, 2025, 10:14 a.m.

Vxceed constrói o discurso de vendas perfeito par…

Este post, coautorado com Cyril Ovely da Vxceed, aborda um desafio premente para empresas de bens de consumo embalados (CPG) em economias emergentes: reter efetivamente a receita e ampliar a fidelidade dos clientes em escala.

All news

AI team for your Business

Automate Marketing, Sales, SMM & SEO

and get clients on autopilot — from social media and search engines. No ads needed

and get clients today