- Pesquisadores desenvolveram um novo gerador de vídeo de IA
- O Generator cria vários estágios de baixa resolução antes de gerar um final de alta resolução
- O gerador de IA tornou-se totalmente de código aberto para uso individual e comercial
Uma equipe de pesquisadores da Universidade de Pequim, da Kuaishou Technology e da Universidade de Correios e Telecomunicações de Pequim fez grandes avanços no campo da geração de vídeo por IA.
Eles desenvolveram um novo modelo de IA, Pyramid Flow, capaz de gerar imagens de vídeo virtual de alta resolução a 768p.
Ao contrário de muitos modelos proprietários de IA desenvolvidos nos últimos anos, os criadores do Pyramid Flow tornaram seu modelo de código aberto, dando aos desenvolvedores e usuários acesso gratuito à tecnologia subjacente.
Um avanço na geração de vídeos com IA?
O modelo Pyramid Flow adota uma abordagem diferente de muitos de seus antecessores, gerando vídeos em vários estágios de baixa resolução antes de produzir um resultado final de alta resolução.
Este método reduz o poder de computação necessário para executar o modelo, tornando-o mais econômico para os usuários. A equipe afirma que o modelo pode produzir um videoclipe de cinco segundos com resolução de 384p em apenas 56 segundos.
O Pyramid Flow também está disponível como software de código aberto, com os desenvolvedores disponibilizando o modelo gratuitamente sob a licença MIT, o que significa que qualquer pessoa pode baixar, modificar e usar o código para fins pessoais ou comerciais.
Junto com o modelo em si, os pesquisadores postaram vários vídeos de amostra demonstrando a qualidade da saída do Pyramid Flow. Os resultados mostram imagens detalhadas e altamente realistas, incluindo exemplos como explosões subaquáticas criando bolhas e respingos de água. Além disso, os conjuntos de dados utilizados para treinar o Pyramid Flow, que consistem em cerca de 10 milhões de vídeos curtos, também estão disponíveis ao público.
A utilização de conjuntos de dados de código aberto na geração de vídeos com IA tem sido uma questão controversa, com alguns críticos alegando que tais práticas violam os direitos dos detentores de direitos autorais.
A equipe de pesquisa por trás do Pyramid Flow não abordou especificamente essas preocupações, mas sugere que o modelo poderia ser uma ferramenta útil para ajustar o material de código aberto, reduzindo potencialmente a necessidade de depender de fontes de terceiros.
Através TechXplore