GoogleDeepMind presentó el viernes el RoboticTransformer2( RT- 2), un innovador modelo de visión, lenguaje y acción( VLA) que aprovecha la información obtenida de Internet para mejorar el control robótico mediante comandos de lenguaje llano con el objetivo de desarrollar robots versátiles capaces de navegar por entornos humanos, como los personajes de ficción Wall- E o C- 3PO. RT- 2 utiliza un modelo de lenguaje amplio, entrenado en el contexto y las imágenes de Internet( similar a ChatGPT), para reconocer patrones y ejecutar acciones, incluso en tareas para las que no ha recibido formación específica. Este concepto, conocido como generalización, permite a RT- 2 realizar tareas como reconocer y desechar basura, basándose en su comprensión de qué es y cómo está dispuesta. La capacidad de generalización de RT- 2 se extiende a la identificación de animales extintos, como demuestra el hecho de que un ingeniero ordene a su robot que" recoja el animal extinto" y que el robot localice con éxito una figurita de dinosaurio entre las tres opciones disponibles. A diferencia de los métodos tradicionales de formación de robots, que se basan únicamente en un conjunto de datos ampliado, el enfoque de RT- 2 aprovecha la capacidad de generalización de los modelos A de transformadores, lo que los hace adaptables a escenarios dinámicos del mundo real. RT- 2 se basa en trabajos anteriores de Google AI, como PaLI- X y PaLM- E, y se entrenó con los datos de su predecesor, RT- 1, recopilados durante 17 meses en un entorno de cocina de oficina con 13 robots.
La arquitectura de RT- 2 consiste en perfeccionar un modelo VLM previamente entrenado con robots y datos web para procesar las imágenes de las cámaras de los robots y sus predicciones. En las evaluaciones de rendimiento, la RT- 2 demostró una eficacia similar a la de la RT- 1 en las tareas para las que fue entrenada( tareas" vistas") y mostró una impresionante tasa de éxito del 62% en escenarios nuevos( no vistos), lo que supone una mejora significativa con respecto al 32% de la RT- 1. Aunque laRT- 2 muestra una capacidad de adaptación notable, Google reconoce sus limitaciones y subraya que la inclusión de datos web mejora la generalización de conceptos visuales importantes, pero no las nuevas capacidades de movimientos físicos que ambos ya han aprendido. A medida que Google DeepMind se esfuerza por crear robots de uso general, se requieren más esfuerzos de investigación y desarrollo.
None
El gobierno saudí está impulsando significativamente la inteligencia artificial enfocada en Hollywood al liderar una ronda de financiación de 900 millones de dólares para Luma AI, una empresa con sede en San Francisco que desarrolla modelos para aplicaciones de entretenimiento.
Durante el último año, los modelos de difusión de video generados por inteligencia artificial han logrado avances notables en realismo visual, como lo demuestran modelos como Sora 2 de OpenAI, Veo 3 de Google y Runway Gen-4.
Nueva York – El sector de publicidad de la economía de creadores está expandiéndose y evolucionando rápidamente, con un gasto publicitario que sube de 13,9 mil millones de dólares en 2021 a 29,5 mil millones en 2024, y las previsiones proyectan un crecimiento a 37 mil millones en breve.
En el entorno digital que cambia rápidamente en la actualidad, el auge de la inteligencia artificial ha transformado profundamente la forma en que las marcas gestionan su visibilidad y presencia en línea.
El informe de ganancias reciente de Nvidia ha capturado una atención significativa de inversores y entusiastas de la tecnología, marcando un hito clave en la revolución de la inteligencia artificial.
En la reciente conferencia Ignite 2025, Microsoft anunció la integración del avanzado modelo de generación de video de OpenAI, Sora 2, en Microsoft 365 Copilot, marcando una importante mejoras en sus herramientas de productividad.
En la Conferencia de Tecnología de GPU de Nvidia (GTC) 2025, el director ejecutivo Jensen Huang realizó una ponencia en la que esbozó un futuro transformador para la inteligencia artificial (IA), describiéndolo como el alcance de un crítico "punto de inflexión".
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today