lang icon English
July 28, 2023, 1:32 p.m.
637

None

Brief news summary

None

GoogleDeepMind presentó el viernes el RoboticTransformer2( RT- 2), un innovador modelo de visión, lenguaje y acción( VLA) que aprovecha la información obtenida de Internet para mejorar el control robótico mediante comandos de lenguaje llano con el objetivo de desarrollar robots versátiles capaces de navegar por entornos humanos, como los personajes de ficción Wall- E o C- 3PO. RT- 2 utiliza un modelo de lenguaje amplio, entrenado en el contexto y las imágenes de Internet( similar a ChatGPT), para reconocer patrones y ejecutar acciones, incluso en tareas para las que no ha recibido formación específica. Este concepto, conocido como generalización, permite a RT- 2 realizar tareas como reconocer y desechar basura, basándose en su comprensión de qué es y cómo está dispuesta. La capacidad de generalización de RT- 2 se extiende a la identificación de animales extintos, como demuestra el hecho de que un ingeniero ordene a su robot que" recoja el animal extinto" y que el robot localice con éxito una figurita de dinosaurio entre las tres opciones disponibles. A diferencia de los métodos tradicionales de formación de robots, que se basan únicamente en un conjunto de datos ampliado, el enfoque de RT- 2 aprovecha la capacidad de generalización de los modelos A de transformadores, lo que los hace adaptables a escenarios dinámicos del mundo real. RT- 2 se basa en trabajos anteriores de Google AI, como PaLI- X y PaLM- E, y se entrenó con los datos de su predecesor, RT- 1, recopilados durante 17 meses en un entorno de cocina de oficina con 13 robots.

La arquitectura de RT- 2 consiste en perfeccionar un modelo VLM previamente entrenado con robots y datos web para procesar las imágenes de las cámaras de los robots y sus predicciones. En las evaluaciones de rendimiento, la RT- 2 demostró una eficacia similar a la de la RT- 1 en las tareas para las que fue entrenada( tareas" vistas") y mostró una impresionante tasa de éxito del 62% en escenarios nuevos( no vistos), lo que supone una mejora significativa con respecto al 32% de la RT- 1. Aunque laRT- 2 muestra una capacidad de adaptación notable, Google reconoce sus limitaciones y subraya que la inclusión de datos web mejora la generalización de conceptos visuales importantes, pero no las nuevas capacidades de movimientos físicos que ambos ya han aprendido. A medida que Google DeepMind se esfuerza por crear robots de uso general, se requieren más esfuerzos de investigación y desarrollo.


Watch video about

None

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 21, 2025, 1:24 p.m.

Arabia Saudita lidera el esfuerzo por invertir 90…

El gobierno saudí está impulsando significativamente la inteligencia artificial enfocada en Hollywood al liderar una ronda de financiación de 900 millones de dólares para Luma AI, una empresa con sede en San Francisco que desarrolla modelos para aplicaciones de entretenimiento.

Nov. 21, 2025, 1:20 p.m.

Cómo nuestro equipo optimiza la infraestructura p…

Durante el último año, los modelos de difusión de video generados por inteligencia artificial han logrado avances notables en realismo visual, como lo demuestran modelos como Sora 2 de OpenAI, Veo 3 de Google y Runway Gen-4.

Nov. 21, 2025, 1:13 p.m.

El gasto en publicidad de la economía de creadore…

Nueva York – El sector de publicidad de la economía de creadores está expandiéndose y evolucionando rápidamente, con un gasto publicitario que sube de 13,9 mil millones de dólares en 2021 a 29,5 mil millones en 2024, y las previsiones proyectan un crecimiento a 37 mil millones en breve.

Nov. 21, 2025, 1:12 p.m.

Los medios ganados se vuelven cruciales en el pan…

En el entorno digital que cambia rápidamente en la actualidad, el auge de la inteligencia artificial ha transformado profundamente la forma en que las marcas gestionan su visibilidad y presencia en línea.

Nov. 21, 2025, 1:11 p.m.

Las ganancias de Nvidia despejan los temores de u…

El informe de ganancias reciente de Nvidia ha capturado una atención significativa de inversores y entusiastas de la tecnología, marcando un hito clave en la revolución de la inteligencia artificial.

Nov. 21, 2025, 9:32 a.m.

Microsoft integra Sora 2 de OpenAI en Microsoft 3…

En la reciente conferencia Ignite 2025, Microsoft anunció la integración del avanzado modelo de generación de video de OpenAI, Sora 2, en Microsoft 365 Copilot, marcando una importante mejoras en sus herramientas de productividad.

Nov. 21, 2025, 9:24 a.m.

El CEO de Nvidia presenta nuevos chips Rubin de i…

En la Conferencia de Tecnología de GPU de Nvidia (GTC) 2025, el director ejecutivo Jensen Huang realizó una ponencia en la que esbozó un futuro transformador para la inteligencia artificial (IA), describiéndolo como el alcance de un crítico "punto de inflexión".

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today