O desenvolvimento de robôs humanoides tem progredido lentamente há quase duas décadas. No entanto, graças a uma colaboração entre Figure AI e OpenAI, houve uma aceleração rápida nesse campo. O resultado é um vídeo impressionante que apresenta o robô Figure 01 com seu novo Modelo de Linguagem Visual (VLM), que o transformou em um robô de ficção científica com capacidades próximas às de C-3PO. No vídeo, o Figure 01 está posicionado atrás de uma mesa com um prato, uma maçã e uma xícara, enquanto um escorredor está à esquerda. Uma pessoa fica em frente ao robô e pergunta: "Figure 01, o que você está vendo agora?" Após alguns momentos, o Figure 01 responde com uma voz surpreendentemente semelhante à humana (apesar de não ter um rosto) e fornece descrições detalhadas de tudo na mesa e da pessoa em frente a ela. Impressionado, penso: "Isso é legal. " Em seguida, a pessoa pergunta: "Ei, posso comer alguma coisa?" O Figure 01 responde confiantemente: "Claro", e habilmente pega a maçã, entregando-a à pessoa. Não pude deixar de exclamar: "Uau. " Em seguida, a pessoa despeja alguns detritos amassados de uma lixeira na frente do Figure 01 enquanto pergunta: "Você pode explicar por que você fez o que acabou de fazer enquanto pega esse lixo?" Sem perder tempo, o Figure 01 explica seu raciocínio enquanto coloca o papel de volta na lixeira. "Então, eu te dei a maçã porque é o único item comestível que eu poderia fornecer da mesa. " Maravilhado, penso: "Isso não pode ser real. " No entanto, de acordo com a Figure AI, é realmente real. O raciocínio de fala para fala desempenha um papel significativo nas habilidades do Figure 01, pois ele utiliza o modelo multimodal pré-treinado da OpenAI, o VLM, para compreender imagens e textos. Ele depende de interações de voz em conversação para formular suas respostas, diferenciando-o do GPT-4 da OpenAI, que se concentra principalmente em estímulos escritos. Além disso, o Figure 01 emprega uma técnica chamada "manipulação bimanual de baixo nível aprendida".
O sistema combina calibração precisa da imagem com sua rede neural para controlar seus movimentos, operando com uma precisão ao nível dos pixels. A Figure AI afirmou: "Essas redes processam imagens internas a 10hz e geram ações de 24 graus de liberdade (poses do pulso e ângulos das articulações dos dedos) a 200hz". A Figure AI afirma que todo comportamento exibido no vídeo é resultado do aprendizado do sistema e que o Figure 01 não é controlado por controle remoto, dissipando quaisquer noções de que ele seja manipulado nos bastidores. Sem testemunhar pessoalmente o Figure 01 e fazer minhas próprias perguntas, é difícil verificar essas afirmações. Existe a possibilidade de essa rotina ter sido praticada várias vezes pelo Figure 01. Talvez esta seja a centésima vez, o que explica sua velocidade e fluidez impressionantes. Mas, caso isso seja realmente 100% real, devo dizer: "Uau". Só wow.
None
Engines de respostas de IA não estão apenas mudando a forma como as pessoas pesquisam online; elas estão redefinindo fundamentalmente a visibilidade dos negócios na era digital.
Em um vídeo de formato curto, uma influencer reage com paixão a uma notícia da Califórnia apresentando visuais aparentemente autênticos, incluindo um âncora incentivando os espectadores a agir, vítimas e o logo da CNN.
AMD e OpenAI anunciaram uma parceria histórica que promete transformar profundamente a infraestrutura de IA.
Molly Peck, que na época era a diretora de marketing (CMO) da Buick e GMC, havia recentemente assumido o cargo de diretora de transformação, com a responsabilidade de reformular a estratégia de conteúdo da GM e suas parcerias com agências.
Assim como em todo lançamento de álbum da Taylor Swift, todos os elementos de The Life of a Showgirl foram cuidadosamente planejados e implementados desde a semana passada, desde trailers teaser até eventos no dia do lançamento e aparições em programas de televisão.
A Google anunciou uma grande expansão de seu recurso de busca alimentado por IA, o 'Modo AI', agora suportando cinco novos idiomas: Hindi, Indonésio, Japonês, Coreano e Português do Brasil.
Este post, coautorado com Cyril Ovely da Vxceed, aborda um desafio premente para empresas de bens de consumo embalados (CPG) em economias emergentes: reter efetivamente a receita e ampliar a fidelidade dos clientes em escala.
Automate Marketing, Sales, SMM & SEO
and get clients on autopilot — from social media and search engines. No ads needed
and get clients today