ByteDance presenta OmniHuman: un revolucionario sistema de generación de videos con inteligencia artificial.

Los investigadores de ByteDance han creado un sistema de IA revolucionario que convierte fotografías individuales en videos realistas de personas hablando, cantando y moviéndose con fluidez, una innovación que promete transformar el entretenimiento digital y la comunicación. El sistema recién desarrollado, llamado OmniHuman, produce videos de cuerpo completo que representan a individuos gesticulando y moviéndose en sincronía con su discurso, superando las limitaciones de los modelos de IA anteriores que solo animaban caras o partes superiores del cuerpo. Entrenar a OmniHuman requirió unas impresionantes 18, 700 horas de datos de video para facilitar un movimiento realista. Según el equipo de investigación de ByteDance, que publicó sus hallazgos en arXiv, "la animación humana de extremo a extremo ha visto mejoras significativas en los últimos años. Sin embargo, los métodos actuales aún tienen dificultades para escalar como modelos de generación de video generales extensos, restringiendo sus aplicaciones prácticas". Para crear OmniHuman, el equipo utilizó una estrategia innovadora que involucró más de 18, 700 horas de datos de video humano, integrando diversas entradas: texto, audio y movimientos del cuerpo. Este método de entrenamiento de "condiciones omnidireccionales" permite a la IA aprovechar conjuntos de datos mucho más grandes y variados que las técnicas anteriores. Este avance en la generación de videos de IA muestra movimiento de cuerpo completo y gestos naturales. El grupo de investigación señaló: "Nuestra principal conclusión es que integrar múltiples señales de condicionamiento, como texto, audio y pose, durante el entrenamiento puede minimizar notablemente el desperdicio de datos". Esta tecnología representa un gran avance en los medios generados por IA, con capacidades que incluyen la producción de videos de individuos dando discursos e ilustrando temas tocando instrumentos musicales.
En pruebas, OmniHuman superó a los sistemas existentes en varias métricas de calidad. A medida que gigantes tecnológicos como Google, Meta y Microsoft compiten por desarrollar tecnologías de IA de video de próxima generación, el avance de ByteDance podría proporcionar una ventaja competitiva a su compañía matriz TikTok en este paisaje en rápida evolución. Los expertos creen que esta tecnología tiene el potencial de revolucionar la producción de entretenimiento, la creación de contenido educativo y la comunicación digital. Sin embargo, también plantea preocupaciones sobre el posible uso indebido de los medios sintéticos para fines engañosos. Los investigadores tienen la intención de presentar sus hallazgos en una próxima conferencia sobre visión por computadora, aunque aún no han anunciado los detalles específicos.
Brief news summary
ByteDance ha lanzado OmniHuman, un sistema de IA revolucionario que transforma imágenes estáticas en videos interactivos y atractivos, completos con discurso, música y movimiento. Este avance representa un hito importante en el entretenimiento digital y la comunicación, permitiendo animaciones de cuerpo completo con gestos dinámicos, lo que supone una mejora significativa con respecto a las tecnologías anteriores que solo capturaban movimientos faciales o del torso. OmniHuman utiliza un extenso conjunto de datos de más de 18,700 horas de video y emplea un sofisticado método de entrenamiento "omni-conditions". Este enfoque combina datos de texto, audio y movimiento, lo que resulta en salidas de video altamente realistas y rápidas. La versatilidad de la tecnología permite una amplia gama de creación de contenido, incluyendo discursos y actuaciones musicales, alcanzando un nivel de calidad que supera a los modelos anteriores. Con competidores importantes como Google, Meta y Microsoft explorando tecnologías similares, el enfoque distintivo de ByteDance le posiciona bien dentro de este campo en rápida evolución. Sin embargo, el surgimiento de OmniHuman también plantea dilemas éticos sobre el posible uso indebido de medios sintéticos. El equipo de investigación planea presentar sus hallazgos en una próxima conferencia de visión por computadora, contribuyendo aún más al discurso sobre esta innovadora tecnología.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Conferencia Virtual para Inversores de Blockchain…
NEW YORK, 6 de junio de 2025 (GLOBE NEWSWIRE) — Virtual Investor Conferences, la principal serie de conferencias de inversores propiedad de la compañía, anunció hoy que las presentaciones de la Conferencia Virtual de Inversores sobre Blockchain y Activos Digitales celebrada el 5 de junio ya están disponibles para su visualización en línea.

Abogados enfrentan sanciones por citar casos fals…
Una jueza sénior del Reino Unido, Victoria Sharp, ha emitido una advertencia contundente a los profesionales del derecho acerca de los peligros de usar herramientas de inteligencia artificial como ChatGPT para citar casos legales falsificados.

¿Qué sucede cuando la gente no comprende cómo fun…
La comprensión errónea generalizada de la inteligencia artificial (IA), especialmente de los grandes modelos de lenguaje (GML) como ChatGPT, tiene consecuencias significativas que requieren un análisis cuidadoso.

Escalable y descentralizado, rápido y seguro, Col…
En el mercado de criptomonedas en constante cambio de hoy, los inversores tienden a gravitar hacia proyectos de blockchain que combinan escalabilidad, descentralización, rapidez y seguridad.

Blockchain en la educación: revolucionando la ver…
El sector educativo enfrenta desafíos importantes para verificar las credenciales académicas y mantener registros seguros.

Exploratorium presenta la exposición 'Aventuras e…
Este verano, el Exploratorium de San Francisco presenta con orgullo su nueva exposición interactiva, "Aventuras en IA", diseñada para ofrecer una exploración completa y atractiva de la inteligencia artificial a los visitantes.

Google presenta Ironwood TPU para inferencia de IA
Google ha presentado su último avance en hardware de inteligencia artificial: el TPU Ironwood, su acelerador de IA más avanzado hasta la fecha.