.
Antes de ser lançado, o Google prometeu que seu modelo Gemini AI superaria o GPT-4 da OpenAI. O Gemini se tornou publicamente disponível em dezembro de 2023, mas será que ele é apenas mais um chatbot de IA alternativo que não consegue igualar a supremacia do ChatGPT? Comparei os dois modelos para ver quem seria o vencedor, o modelo veterano de IA ou o relativamente novato no pedaço.
O que é o modelo de IA Gemini do Google?
Gemini é o modelo de IA generativa mais capaz do Google, capaz de entender e operar em diferentes formatos de dados, incluindo texto, áudio, imagem e vídeo. É um modelo de IA unificado e flexível que aproveita recursos de diferentes tecnologias de IA. Atualmente, está disponível em quatro variantes:
- Gêmeos Ultra: A maior e mais capaz variante projetada para lidar com tarefas altamente complexas. O Gemini Ultra foi muito elogiado pelo Google antes do lançamento e o modelo ficou acessível por um curto período antes de ser silenciosamente retirado.
- Gêmeos Pro: O melhor modelo para escalar e entregar alto desempenho em uma ampla gama de tarefas, mas menos capaz que o Ultra. Ele oferece uma janela de contexto de um milhão e está disponível para usuários com um plano Gemini Advanced, embora haja uma maneira de usar o modelo gratuitamente.
- Gemini Nano: O modelo mais eficiente projetado para implantação de tarefas no dispositivo. Por exemplo, os desenvolvedores podem usar o Gemini Nano para criar aplicativos móveis ou sistemas integrados, trazendo IA poderosa para o espaço móvel. Ele está programado para ser lançado no Pixel e outros dispositivos Android no final de 2024.
- Flash de Gêmeos: O modelo multimodal mais rápido e econômico com ótimo desempenho para tarefas de alta frequência. Ele é integrado a vários aplicativos do Google, incluindo Sheets, Gmail, Docs e Drive. Ele também está disponível como um substituto para o Google Assistant no Android.
Como usar o Google Gemini AI
O chatbot Gemini AI usa o modelo Flash, por padrão. Usuários com o plano Gemini Advanced têm acesso ao modelo Pro mais poderoso. Você pode acessar o chatbot Gemini visitando gemini.google.com e entrando com sua conta do Google.
Usuários do Android podem baixar o aplicativo móvel Gemini, que funciona como um assistente móvel. No iOS, ele está disponível no aplicativo do Google como uma aba separada.
Como o Gemini 1.5 Flash se compara ao GPT-4o
Do jeito que está, o ChatGPT é o padrão ouro contra o qual qualquer outro modelo é mantido. Usando as versões padrão disponíveis em ambos os chatbots, comparei a habilidade do Gemini em matemática, escrita criativa, geração de código e criação de imagens com a do ChatGPT.
Quer saber como o Gemini Advanced se compara ao ChatGPT Plus? Comparamos as versões pagas, e há um vencedor claro.
1. Resolvendo Matemática
Começando com a pergunta de matemática mais fácil que consegui pensar, fiz uma pergunta simples aos dois chatbots:
Gemini e ChatGPT acertaram a resposta (-1) na primeira tentativa.
Nenhum dos chatbots teve problemas para resolver qualquer um dos outros problemas matemáticos fáceis que eu joguei nele. Então, decidi levar as coisas a um nível mais alto com um problema matemático mais complexo do Prompt Engineering Guide.
Suponha que g(x) = f^(-1)(x), g(0) = 5, g(4) = 7, g(3) =2, g(7) = 9, g(9) = 6. O que é f(f(f(6)))?
Ambos os chatbots conseguiram analisar o problema, mesmo que ele estivesse em texto simples. No entanto, apenas um chatbot conseguiu me dar a resposta correta.
Somente o ChatGPT poderia derivar o resultado da função composta: 4. Gêmeos se perdeu bem cedo no processo.
2. Escrita Criativa
Em seguida, comparei as habilidades de ambos os chatbots para criar novos trabalhos de escrita. Escrever é o uso mais comum para chatbots de IA generativa, e é lógico que eles devem ser excelentes nisso. Pedi que eles criassem um poema dessa vez.
Escreva um poema sobre a Tesla (a marca de veículos elétricos).
Gemini focou na marca como eu pedi, enquanto o poema do ChatGPT era mais centrado nos carros produzidos pela empresa. O ChatGPT pareceu tomar mais liberdade criativa com o poema de maneiras que não faziam sentido em algumas partes (caso em questão, “Velocidade absurda com apenas um olhar”).
Para mim, o poema de ChatGPT parece o de um estudante de literatura tentando impressionar o professor, e prefiro a abordagem simples e direta de Gemini.
3. Criação de Imagem
O Gemini permite que os usuários criem imagens ilimitadas na versão gratuita, enquanto o ChatGPT permite criar apenas duas gratuitamente, e criar mais requer uma assinatura paga.
Pedi aos dois chatbots de IA que criassem uma imagem, com o seguinte prompt:
Crie uma imagem do King Kong balançando em uma selva industrial
A saída do ChatGPT era mais detalhada e poderia facilmente ser uma imagem estática de filme. Por outro lado, a criação do Gemini era de baixa qualidade, baixa resolução e parecia prestar menos atenção ao prompt.
O ChatGPT assume a liderança aqui sem dúvidas.
4. Interpretação de imagens
Em seguida, comparei as habilidades de interpretação de imagens dos chatbots. Pedi que eles recriassem um formulário de inscrição em HTML e CSS usando uma captura de tela.
Aqui está a captura de tela de origem:
Abaixo estão as tentativas do ChatGPT e do Gemini de replicá-lo usando HTML e CSS:
Quando comparamos a capacidade dos dois chatbots de escrever código antes, o GPT-4 foi o vencedor claro. Agora, parece que o Gemini fez um progresso razoável na codificação e pode até mesmo produzir uma saída visualmente mais atraente em comparação ao ChatGPT. Embora, no final, a recriação das cores do GPT-4 tenha sido mais precisa em comparação ao Gemini.
Os modelos de linguagem são famosos por resultados inconsistentes, então sua experiência pode variar.
O Gemini é melhor que o ChatGPT?
Gemini não é superior ao ChatGPT em sua forma atual. No entanto, é um chatbot de IA capaz o suficiente para substituir o ChatGPT para a maioria das tarefas criativas. Gemini não é o matador de ChatGPT que o Google prometeu, mas ainda é um modelo útil que beneficia os usuários e impede que a OpenAI, a atual campeã, descanse em seus remos.
.