A OpenAI anunciou na segunda-feira que lançará sua popular ferramenta de geração de vídeo de IA, Sora, no final do dia.
O modelo de geração de vídeo AI funciona de forma semelhante à ferramenta AI de geração de imagem da OpenAI, DALL-E: um usuário entra em uma cena desejada e Sora retorna um videoclipe de alta resolução. Sora também pode criar videoclipes inspirados em imagens estáticas e expandir vídeos existentes ou preencher quadros ausentes. A startup de inteligência artificial apoiada pela Microsoft, que se tornou popular no ano passado graças à popularidade viral do ChatGPT, apresentou o Sora em fevereiro.
De acordo com a transmissão ao vivo da OpenAI no YouTube, ela será lançada para usuários dos EUA e “a maioria dos países internacionais” ainda hoje, e a empresa ainda não tem “um cronograma” para lançar a ferramenta na Europa e no Reino Unido, bem como em alguns outros países.
De acordo com a OpenAI, os usuários não precisarão pagar a mais pela ferramenta, pois ela será incluída nas contas ChatGPT existentes, como Plus e Pro. A equipe do Livestream e o CEO da OpenAI, Sam Altman, demonstraram recursos como “mistura” (ou seja, mesclar duas cenas sob o comando do usuário) e a opção de repetir indefinidamente um vídeo gerado por IA.
Até agora, Sora está disponível principalmente para um pequeno grupo de testadores de segurança, chamados “red teamers”, que testam o modelo em busca de vulnerabilidades em áreas como desinformação e preconceito.
Os usuários do Reddit perguntaram aos executivos da OpenAI em outubro sobre a data de lançamento do Sora, questionando se ele foi adiado “devido ao tempo computacional/tempo necessário para tirar a conclusão ou por razões de segurança”. Em resposta, Kevin Weil, chefe de produto da OpenAI, escreveu: “O modelo precisa ser aperfeiçoado, a segurança/representação/outras coisas precisam estar corretas e o poder da computação precisa ser dimensionado!”
“Como OpenAI, obviamente temos um grande alvo nas nossas costas”, disse Rohan Sahai, líder de produto Sora da OpenAI, na transmissão ao vivo, acrescentando que a empresa precisa prevenir o uso ilegal da tecnologia. “Mas também queremos equilibrar isso com expressão criativa.”
A OpenAI fechou sua última rodada de financiamento em outubro com uma avaliação de US$ 157 bilhões, incluindo os US$ 6,6 bilhões que a empresa levantou de uma extensa lista de empresas de investimento e grandes empresas de tecnologia. A empresa também recebeu uma linha de crédito rotativo de US$ 4 bilhões, aumentando sua liquidez total para mais de US$ 10 bilhões.
Tudo isso faz parte de um sério plano de crescimento para OpenAI Microsoft-lutas de startups apoiadas no campo da inteligência artificial Amazônia-suportado Antrópico, xAI de Elon Musk, Google, metaA Microsoft e a Amazon representam a maior parte do mercado de IA generativa, que deverá atingir mais de 1 bilião de dólares em vendas dentro de uma década.
No início deste mês, a OpenAI contratou seu primeiro diretor de marketing e anunciou que investiria mais em marketing para aumentar sua base de usuários. E em outubro, a OpenAI revelou um recurso de busca dentro do ChatGPT que o posiciona melhor para competir com mecanismos de busca como Google, Bing e Perplexity da Microsoft, atraindo potencialmente mais usuários que de outra forma teriam visitado esses sites para pesquisar na web.
Com o Sora, o fabricante do ChatGPT pretende competir com ferramentas de geração de vídeo de IA de empresas como Meta e Google, que anunciou o Lumiere em janeiro. Ferramentas de IA semelhantes estão disponíveis em outras startups, como Stable Video Diffusion da Stability AI. A Amazon também lançou o Create with Alexa, um modelo especializado na criação de conteúdo animado curto e baseado em prompts para crianças.
O vídeo pode ser a próxima fronteira para a IA generativa depois que os chatbots e os geradores de imagens chegarem ao mundo do consumidor e dos negócios. Embora as possibilidades criativas possam entusiasmar alguns entusiastas da IA, as novas tecnologias levantam sérios problemas de desinformação durante eleições políticas importantes em todo o mundo. De acordo com dados da Clarity, uma empresa de aprendizado de máquina, o número de deepfakes gerados por IA criados aumentou 900% ano após ano.
A OpenAI fez da multimodalidade – a combinação de geração de texto, imagem e vídeo – um objetivo fundamental no seu esforço para oferecer uma gama mais ampla de modelos de IA.
A notícia da libertação de Sora segue a decisão dos manifestantes de vazar uma aparente cópia de Sora devido a preocupações sobre o tratamento dispensado aos artistas pelo fabricante do ChatGPT.
Alguns membros do programa de acesso antecipado da OpenAI para Sora, que supostamente incluía cerca de 300 artistas, publicaram uma carta aberta no final de novembro criticando a OpenAI por não ser suficientemente aberta ou apoiar as artes além do marketing.
“Caros senhores corporativos da IA”, diz a carta aberta dos manifestantes, “recebemos acesso ao Sora com a promessa de sermos os primeiros testadores, red-teamers e parceiros criativos. No entanto, acreditamos que estamos sendo levados a fazer uma ‘lavagem artística’ para contar a história.” O mundo sabe que Sora é uma ferramenta útil para artistas.
A carta continua dizendo que centenas de artistas forneceram trabalho não remunerado para a OpenAI por meio de testes de bugs e feedback sobre Sora, e que “enquanto centenas contribuem gratuitamente, alguns são selecionados através de uma competição para exibir seus filmes criados por Sora – e que com remuneração mínima”, o que empalidece em comparação com o valor significativo de relações públicas e marketing que a OpenAI recebe.”
“Não nos opomos ao uso da tecnologia de IA como ferramenta para as artes (se o fossemos, provavelmente não teríamos sido convidados para este programa)”, diz a carta aberta. “O que discordamos é a forma como este programa artístico foi apresentado e a forma como a ferramenta está evoluindo antes de um possível lançamento público. Compartilhamos isso com o mundo na esperança de que a OpenAI se torne mais aberta, amigável aos artistas e apoie as artes além das ações de relações públicas.”
No final de novembro, um porta-voz da OpenAI respondeu às ações dos manifestantes numa declaração à CNBC.
“Centenas de artistas em nosso alfa moldaram o desenvolvimento do Sora e ajudaram a priorizar novos recursos e medidas de segurança”, disse o porta-voz da OpenAI na época. “A participação é voluntária e não há obrigação de fornecer feedback ou usar a ferramenta. Temos o prazer de fornecer acesso gratuito a esses artistas e continuaremos a apoiá-los através de bolsas, eventos e outros programas.”