Runway lanza Gen-4 un modelo de video que redefine la consistencia visual

1 abril, 2025

El nuevo modelo Gen-4 de Runway promete revolucionar la creación de videos con su enfoque en la consistencia de personajes y objetos.

Miguel Ángel G.P.

IT Manager. Big Data, IA, Ingeniería, Informática corporativa, Apple…

Runway ha presentado su más reciente innovación en generación de video: el modelo Gen-4, diseñado para abordar uno de los principales desafíos en este campo: la consistencia de personajes y objetos a lo largo de las escenas. Esta nueva herramienta se destaca por su capacidad de crear videos más dinámicos y con movimientos realistas, manteniendo al mismo tiempo un estilo homogéneo en todos los fotogramas.

Según la compañía, Gen-4 establece un nuevo estándar en la generación de videos, representando una evolución notable en comparación con su predecesor, Gen-3 Alpha.

Un enfoque innovador para la consistencia de personajes

Una de las grandes novedades de Gen-4 radica en su habilidad para mantener la uniformidad de personajes utilizando únicamente una imagen de referencia, independientemente de las variaciones en iluminación, ubicaciones o tratamientos visuales. Este modelo combina referencias visuales con instrucciones textuales, lo que permite preservar estilos a lo largo de todo el video.

Runway ha descrito a Gen-4 como un hito significativo en la simulación de la física del mundo real por parte de modelos generativos visuales. Gracias a esta tecnología, los usuarios pueden situar cualquier objeto o sujeto en distintos escenarios sin perder la coherencia visual.

Para demostrar las capacidades de este nuevo modelo, Runway ha creado varios cortometrajes. Uno de ellos, titulado «New York is a Zoo«, muestra la consistencia de los personajes al incluir los mismos animales en diversas escenas neoyorquinas, combinando imágenes de animales con fotografías de la ciudad. Por otro lado, «The Herd» presenta una emocionante escena de persecución en un campo de vacas durante la noche, donde Gen-4 logra mantener las apariencias de los personajes usando solo un par de imágenes de referencia.

Amplía el contexto: Open-Sora 2.0 revoluciona la generación de video AI con costos de entrenamiento reducidos

Otro ejemplo, «The Retrieval», ilustra a exploradores en busca de una flor misteriosa y fue generado en menos de una semana, poniendo de manifiesto la rapidez y eficiencia del modelo.

El modelo de imagen a video Gen-4 está disponible para suscriptores de pago y clientes empresariales, y se espera que en una futura actualización se añadan funciones de referencia. Los interesados pueden explorar más ejemplos en el sitio web de RunwayML.

RunwayML se ha consolidado como un actor clave en la tecnología de video basada en IA, con una valoración cercana a los $4 mil millones y reportando ingresos anuales de $80 millones en diciembre de 2024, con proyecciones que apuntan a $300 millones para 2025. Este crecimiento la posiciona como la competencia más fuerte de Sora de OpenAI.

DESCUBRE MÁS SOBRE EL TEMA

Investigación y Desarrollo

Generación de Video

Microsoft lanza Phi-4 un modelo de razonamiento que destaca en dispositivos móviles y PCs

Google y Apple se alían para llevar la inteligencia artificial Gemini a los iPhone en 2025

Runway lanza Gen-4 un modelo de video que redefine la consistencia visual

Un enfoque innovador para la consistencia de personajes

DESCUBRE MÁS SOBRE EL TEMA

Microsoft lanza Phi-4 un modelo de razonamiento que destaca en dispositivos móviles y PCs

Google y Apple se alían para llevar la inteligencia artificial Gemini a los iPhone en 2025

Duolingo revoluciona su catálogo con 148 nuevos cursos gracias a la inteligencia artificial

Google lanza Tiny Lesson para aprender vocabulario en situaciones cotidianas

Freepik lanza F Lite su generador de imágenes impulsado por IA con contenido licenciado

Los agentes de IA aún no alcanzan la precisión de los analistas financieros humanos

Deja el primer comentario (cancelar respuesta)