lang icon En
May 10, 2024, 10:22 a.m.
1753

None

Brief news summary

Los algoritmos de aprendizaje por refuerzo son altamente efectivos en sistemas virtuales como ChatGPT o algoritmos de recomendación de YouTube, pero son difíciles de transferir a robots del mundo real. Sin embargo, investigadores de la Universidad Northwestern han desarrollado un nuevo algoritmo llamado Aprendizaje por Refuerzo de Difusión Máxima (MaxDiff RL) que aborda este desafío. La mayoría de los algoritmos de aprendizaje por refuerzo asumen que los datos de los que aprenden son independientes e identicamente distribuidos, pero las experiencias de los robots del mundo real están inherentemente correlacionadas. MaxDiff RL anima a los robots a explorar una amplia gama de experiencias siendo aleatoriamente aventureros. Se centra en maximizar la diversidad de cambios de estado en lugar de acciones, permitiendo que los robots conceptualicen metas y aprendan qué acciones les ayudarán a alcanzar esas metas de forma segura. En pruebas, MaxDiff RL superó a otros algoritmos de aprendizaje por refuerzo, adaptándose rápidamente a nuevas tareas. Sin embargo, todavía no es adecuado para implementarse en autos autónomos u otras aplicaciones del mundo real.

Investigadores de la Universidad de Northwestern han desarrollado un nuevo algoritmo, el Aprendizaje Reforzado de Difusión Máxima (MaxDiff RL, por sus siglas en inglés), específicamente diseñado para robots. Los algoritmos tradicionales de aprendizaje reforzado requieren una gran cantidad de datos antes de que puedan rendir bien, lo que dificulta transferir su desempeño a robots físicos. MaxDiff RL supera este problema al fomentar que los robots exploren una amplia gama de experiencias.

El algoritmo se centra en maximizar la diversidad de cambios de estado en lugar de acciones, lo que permite a los robots conceptualizar metas y determinar acciones seguras para alcanzarlas. En pruebas simuladas, MaxDiff RL superó a otros algoritmos de aprendizaje reforzado, adaptándose rápidamente a nuevas tareas. Sin embargo, se necesita seguir trabajando antes de implementar este algoritmo en aplicaciones del mundo real como los automóviles autónomos.


Watch video about

None

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 19, 2025, 9:32 a.m.

Resumen del mercado: Cómo los vendedores de Amazo…

La orientación pública de Amazon sobre cómo optimizar las menciones de productos para Rufus, su asistente de compras impulsado por IA, permanece sin cambios, sin nuevas recomendaciones para los vendedores.

Dec. 19, 2025, 9:25 a.m.

Adobe se alía con Runway para llevar la generació…

Adobe ha revelado una colaboración plurianual con Runway que integra capacidades de video generativo directamente en Adobe Firefly y, progresivamente, más profundamente en Creative Cloud.

Dec. 19, 2025, 9:21 a.m.

Anthropic busca dominar la inteligencia artificia…

Anthropic, un destacado líder en el desarrollo de inteligencia artificial, ha lanzado nuevas herramientas destinadas a ayudar a las empresas a incorporar de manera sencilla la IA en sus entornos laborales.

Dec. 19, 2025, 9:14 a.m.

Insightly incorpora IA en la plataforma de CRM

Insightly, una destacada plataforma de gestión de relaciones con clientes (CRM), ha presentado "Copilot", un chatbot potenciado por inteligencia artificial que integra inteligencia artificial generativa en su sistema para mejorar la productividad de los usuarios y simplificar la gestión del CRM.

Dec. 19, 2025, 9:14 a.m.

Qwen lanza la nueva función de Mini-Teatro de IA

Qwen, un líder pionero en tecnología de inteligencia artificial, ha presentado su nueva función AI Mini-Theater, representando un avance importante en las experiencias de usuario impulsadas por IA.

Dec. 19, 2025, 5:37 a.m.

Los videos deepfake generados por inteligencia ar…

El rápido avance de la inteligencia artificial ha llevado a innovaciones notables, especialmente en la tecnología deepfake.

Dec. 19, 2025, 5:28 a.m.

Yann LeCun de Meta apunta a una valoración de 3,5…

Yann LeCun, reconocido investigador de IA y próximamente exjefe de ciencia de IA en Meta, está lanzando una startup revolucionaria en inteligencia artificial.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today