A Runway apresentou sua mais recente inovação em geração de vídeo: o modelo Gen-4, projetado para enfrentar um dos principais desafios neste campo: a consistência de personagens e objetos ao longo das cenas. Esta nova ferramenta se destaca por sua capacidade de criar vídeos mais dinâmicos e com movimentos realistas, mantendo ao mesmo tempo um estilo homogêneo em todos os quadros.
Segundo a empresa, o Gen-4 estabelece um novo padrão na geração de vídeos, representando uma evolução notável em comparação com seu predecessor, o Gen-3 Alpha.
Uma abordagem inovadora para a consistência de personagens
Uma das grandes novidades do Gen-4 reside em sua habilidade de manter a uniformidade de personagens utilizando apenas uma imagem de referência, independentemente das variações em iluminação, locais ou tratamentos visuais. Este modelo combina referências visuais com instruções textuais, permitindo preservar estilos ao longo de todo o vídeo.
A Runway descreveu o Gen-4 como um marco significativo na simulação da física do mundo real por parte de modelos generativos visuais. Graças a essa tecnologia, os usuários podem situar qualquer objeto ou sujeito em diferentes cenários sem perder a coerência visual.
Para demonstrar as capacidades deste novo modelo, a Runway criou vários curtas-metragens. Um deles, intitulado «New York is a Zoo«, mostra a consistência dos personagens ao incluir os mesmos animais em diversas cenas nova-iorquinas, combinando imagens de animais com fotografias da cidade. Por outro lado, «The Herd» apresenta uma emocionante cena de perseguição em um campo de vacas durante a noite, onde o Gen-4 consegue manter as aparências dos personagens usando apenas um par de imagens de referência.
Outro exemplo, «The Retrieval», ilustra exploradores em busca de uma flor misteriosa e foi gerado em menos de uma semana, evidenciando a rapidez e eficiência do modelo.
O modelo de imagem para vídeo Gen-4 está disponível para assinantes pagos e clientes empresariais, e espera-se que em uma futura atualização sejam adicionadas funções de referência. Os interessados podem explorar mais exemplos no site da RunwayML.
A RunwayML se consolidou como um ator chave na tecnologia de vídeo baseada em IA, com uma avaliação próxima a $4 bilhões e reportando receitas anuais de $80 milhões em dezembro de 2024, com projeções que apontam para $300 milhões em 2025. Esse crescimento a posiciona como a concorrente mais forte da Sora da OpenAI.