Runway lanza Gen-4 un modelo de video que redefine la consistencia visual

1 abril, 2025

El nuevo modelo Gen-4 de Runway promete revolucionar la creación de videos con su enfoque en la consistencia de personajes y objetos.

Runway ha presentado su más reciente innovación en generación de video: el modelo Gen-4, diseñado para abordar uno de los principales desafíos en este campo: la consistencia de personajes y objetos a lo largo de las escenas. Esta nueva herramienta se destaca por su capacidad de crear videos más dinámicos y con movimientos realistas, manteniendo al mismo tiempo un estilo homogéneo en todos los fotogramas.

Según la compañía, Gen-4 establece un nuevo estándar en la generación de videos, representando una evolución notable en comparación con su predecesor, Gen-3 Alpha.

Un enfoque innovador para la consistencia de personajes

Una de las grandes novedades de Gen-4 radica en su habilidad para mantener la uniformidad de personajes utilizando únicamente una imagen de referencia, independientemente de las variaciones en iluminación, ubicaciones o tratamientos visuales. Este modelo combina referencias visuales con instrucciones textuales, lo que permite preservar estilos a lo largo de todo el video.

Runway ha descrito a Gen-4 como un hito significativo en la simulación de la física del mundo real por parte de modelos generativos visuales. Gracias a esta tecnología, los usuarios pueden situar cualquier objeto o sujeto en distintos escenarios sin perder la coherencia visual.

Para demostrar las capacidades de este nuevo modelo, Runway ha creado varios cortometrajes. Uno de ellos, titulado «New York is a Zoo«, muestra la consistencia de los personajes al incluir los mismos animales en diversas escenas neoyorquinas, combinando imágenes de animales con fotografías de la ciudad. Por otro lado, «The Herd» presenta una emocionante escena de persecución en un campo de vacas durante la noche, donde Gen-4 logra mantener las apariencias de los personajes usando solo un par de imágenes de referencia.

Amplía el contexto:  Open-Sora 2.0 revoluciona la generación de video AI con costos de entrenamiento reducidos

Otro ejemplo, «The Retrieval», ilustra a exploradores en busca de una flor misteriosa y fue generado en menos de una semana, poniendo de manifiesto la rapidez y eficiencia del modelo.

El modelo de imagen a video Gen-4 está disponible para suscriptores de pago y clientes empresariales, y se espera que en una futura actualización se añadan funciones de referencia. Los interesados pueden explorar más ejemplos en el sitio web de RunwayML.

RunwayML se ha consolidado como un actor clave en la tecnología de video basada en IA, con una valoración cercana a los $4 mil millones y reportando ingresos anuales de $80 millones en diciembre de 2024, con proyecciones que apuntan a $300 millones para 2025. Este crecimiento la posiciona como la competencia más fuerte de Sora de OpenAI.

Deja el primer comentario