Fiquei intrigado e impressionado quando o OpenAI demonstrou Sora pela primeira vez no início deste ano. Parecia não haver limite para os filmes que o modelo de vídeo de IA poderia produzir a partir de um prompt de texto. Sora poderia facilmente transformar descrições em vídeos imersivos e realistas, e a OpenAI timidamente sugeriu um lançamento geral em um futuro próximo. Meses depois, apenas cineastas profissionais parceiros da OpenAI têm acesso real (um vazamento breve e recente não conta). O mesmo vale para outros geradores de vídeo de IA muito elogiados, incluindo Movie Gen da Meta e Veo do Google.
Muitos ótimos geradores de vídeo de IA surgiram desde que Sora surpreendeu as pessoas, mas é difícil não se sentir como uma criança com o nariz pressionado contra o vidro da loja de brinquedos, se perguntando por que não podemos brincar um pouquinho com os brinquedos. É por isso que acho que o OpenAI e o resto dos reticentes modelos de criação de vídeo de IA ainda estão trancados.
Trailers de filmes sempre levam à decepção
Talvez eu seja apenas um cético, mas acho estranho como OpenAI, Meta e Google aparentemente mal podiam esperar para exibir demonstrações de seus respectivos geradores de vídeo de IA sem sequer uma vaga noção de uma data de lançamento. Isso me faz pensar em trailers de filmes que são lançados um ano antes do filme e prometem muito mais do que a versão final pode oferecer. Eu me pergunto se Sora, Movie Gen e Veo ainda terão mais do que um pouco de comida para cozinhar antes de colocarmos as mãos neles.
As demonstrações meticulosamente selecionadas podem não ser apenas os melhores exemplos dos modelos de IA, mas também os únicos que valem a pena mostrar ao público. O resultado padrão de Sora pode ser mais um sonho febril do que uma visão celestial. Talvez pedir um “pôr do sol sereno sobre um lago” apenas ocasionalmente resulte em uma noite tranquila na água. Se nove em cada dez clipes de Sora retratam um lago derretendo em um abismo verde neon sob um sol tremeluzindo como uma luz estroboscópica assombrada, eu não faria isso. Não culpo a OpenAI por segurar Sora por enquanto.
Ética (ou exposição legal)
As empresas por trás de ferramentas de IA para a criação de imagens e vídeos geralmente fazem questão de destacar seu treinamento ético e controles de produção sempre que possível. Sora não é exceção, mas os limites do modelo ético ficam muito mais confusos para vídeos em comparação com imagens, especialmente porque o vídeo é essencialmente um grande número de imagens encadeadas.
A coleta de dados não aprovada para fazer deepfakes de pessoas reais sem o seu conhecimento e a produção de filmes com personagens e logotipos de marcas registradas sem permissão abrem as portas de um vasto campo minado legal e ético. Trabalhar com cineastas profissionais e diretores de vídeos comerciais elimina esses problemas porque a empresa de tecnologia pode observar de perto o resultado da IA e evitar infrações casuais.
Onde está o lucro?
Por mais que OpenAI, Adobe, Google e Meta gostem de exibir sua tecnologia, as pessoas que controlam o orçamento querem saber de onde vem o retorno desse investimento e quando. O objetivo é um gerador de vídeo de IA sofisticado e comercializável, não um brinquedo legal. Um playground de vídeo de IA gratuito para experimentar e cometer erros é um passo no caminho, não o destino.
Embora não saibamos o custo exato, é possível que os videomakers de IA de ponta sejam tão caros em comparação com Runway ou Dream Machine. O poder de processamento necessário é certamente impressionante em comparação com a composição de texto de IA. Aumentá-lo sem restrições pode causar o colapso do servidor. Permitir que estudantes entediados façam clipes curtos de um cachorro tocando violino em um submarino pode não valer a pena gastar o Sora 24 horas por dia para milhões de usuários. Limitar o acesso a profissionais aprovados dá mais controle às empresas.
É quase certo que a OpenAI está trabalhando em estratégias para ganhar dinheiro com hobbyistas, pequenas empresas de marketing e estúdios de cinema dispostos a pagar pelo acesso contínuo a geradores avançados de vídeo de IA, como o Sora. Mas até que sejam tão acessíveis quanto as assinaturas de versões premium do ChatGPT, Gemini e outros chatbots de IA, apenas os bolsos mais profundos do cinema provavelmente terão acesso ao Sora e seus modelos irmãos. Até então, somos apenas espectadores.