.
O que você precisa saber
- De acordo com um artigo de pesquisa do Google, o Imagen 3 tem um desempenho excelente, criando imagens de alta qualidade a partir de texto e superando outros modelos em testes.
- O Imagen 3 melhorou a compreensão dos avisos do usuário e inclui proteções contra a geração de conteúdo ofensivo ou ilegal, diferentemente do mais controverso Grok-2 da xAI.
- Comentários sugerem que o Imagen 3 tem restrições mais rígidas em comparação aos modelos anteriores, provavelmente como uma resposta a problemas com o modelo anterior Gemini do Google.
O Google acaba de lançar o Imagen 3, seu gerador de imagens atualizado e alimentado por IA, mas em vez da grande revelação de sempre, a gigante da tecnologia decidiu disponibilizar o modelo avançado para todos nos EUA sem muito alarde.
Um artigo de pesquisa do Google, descoberto pelo VentureBeat, descreve o Imagen 3 como um modelo de difusão latente que se destaca na criação de imagens de alta qualidade a partir de prompts de texto. O artigo também afirma que o Imagen 3 superou outros modelos em testes.
O Google apresentou pela primeira vez seu gerador avançado de imagens em sua conferência I/O em maio. Mas foi somente no final deste mês que a empresa o tornou amplamente disponível por meio de sua plataforma Vertex AI.
A gigante da tecnologia alegou grandes melhorias em quão bem o Imagen 3 entende os prompts do usuário. Como outros geradores de imagens de IA, ele pode criar visuais detalhados a partir de descrições de texto, mas tem limites para gerar conteúdo ofensivo ou ilegal. Para evitar o uso indevido, o modelo não produzirá imagens de figuras públicas ou quaisquer visuais relacionados a armas.
Isso contrasta com o Grok-2 da xAI, que tem menos restrições e se tornou um ponto de encontro para imagens controversas na web.
O feedback do usuário revela que o Imagen 3 vem com restrições mais rígidas em comparação às versões anteriores, refletindo os maiores desafios em torno dos geradores de imagens de IA. Essas ferramentas têm provocado debates contínuos, com novos conteúdos gerados por IA frequentemente chamando a atenção, gerando controvérsia ou dividindo opiniões online.
O Google parece estar adotando uma abordagem cautelosa com o lançamento do Imagen 3. Ainda não está claro se ele manterá essa postura conservadora conforme o modelo evolui.
A abordagem cautelosa do Google com o Imagen 3 pode ser uma reação à reação negativa contra seu modelo Gemini no início deste ano. Depois que o Gemini produziu imagens historicamente imprecisas que distorceram a representação racial, o Google pausou sua geração de imagens para consertar os problemas.
A empresa sediada em Mountain View também mencionou que o Imagen 3 virá em diferentes versões adaptadas para vários usos, como esboços rápidos ou criação de imagens de alta resolução.
Os usuários também podem ajustar as imagens escolhendo áreas específicas e dando instruções detalhadas. Para conferir, vá para o site AI Test Kitchen do Google, faça login com sua conta do Google e mergulhe na plataforma.
.