xAI, uma empresa de propriedade de Elon Musk, adicionou recursos de compreensão de imagem ao seu modelo Grok AI. Isso permite que usuários pagantes da plataforma social X carreguem uma imagem e façam perguntas ao chatbot de IA sobre ela.
Um dos funcionários da xAI e o identificador oficial do Grok postaram sobre esta atualização no X.
Em uma postagem separada, Musk disse que Grok pode até explicar o significado de uma piada por meio do novo recurso de compreensão de imagens. Ele acrescentou que a funcionalidade ainda está em seus estágios iniciais e irá melhorar com o tempo.
Em agosto, a empresa de IA de Musk lançou o Grok-2 como modelo e chatbot para usuários premium no X. O chatbot da rede social também recebeu recursos de geração de imagens utilizando o modelo FLUX.1 da Black Forest Labs.
Na época, a xAI anunciou que lançaria o entendimento multimodal como parte da experiência da Grok com o X e a API do desenvolvedor.
Grok logo poderá entender os documentos também. Em resposta ao feedback de um usuário de que Grok não conseguia lidar com fotos ou PDFs, Musk disse: “Não por muito tempo”. Podemos fazer em meses o que todo mundo levou anos.”
A rede social tentou adicionar mais recursos ao seu chatbot de IA e níveis de usuários pagos para tornar a oferta mais atraente. No início deste mês, X lançou uma nova ferramenta chamada Radar para assinantes Premium+ para monitorar tendências em tempo real e fornecer informações sobre as conversas.