.
Na terça -feira, o Google lançou Gemini 2.5, uma nova família de modelos de raciocínio de IA que faz uma pausa para “pensar” antes de responder a uma pergunta.
Para iniciar a nova família de modelos, o Google está lançando a Gemini 2.5 Pro Experimental, um modelo de IA multimodal e raciocínio que a empresa afirma ser o seu modelo mais inteligente até agora. Este modelo estará disponível na terça-feira na plataforma de desenvolvedores da empresa, o Google AI Studio, bem como no aplicativo Gemini para assinantes do plano de IA de US $ 20 por mês, de US $ 20 por mês, Gemini Advanced.
Avançando, o Google diz que todos os seus novos modelos de IA terão recursos de raciocínio assados.
Desde que o OpenAI lançou o primeiro modelo de raciocínio de IA em setembro de 2024, O1, a indústria de tecnologia correu para combinar ou exceder os recursos desse modelo com os seus. Hoje, antropia, Deepseek, Google e Xai têm modelos de raciocínio de IA, que usam poder de computação extra e tempo para verificar e raciocinar os problemas antes de fornecer uma resposta.
As técnicas de raciocínio ajudaram os modelos de IA a alcançar novas alturas nas tarefas de matemática e codificação. Muitos no mundo da tecnologia acreditam que os modelos de raciocínio serão um componente essencial de agentes de IA, sistemas autônomos que podem executar tarefas em grande parte intervenção humana. No entanto, esses modelos também são mais caros.
O Google já experimentou modelos de raciocínio de IA antes, divulgando anteriormente uma versão “pensante” de Gemini em dezembro. Mas o Gemini 2.5 representa a tentativa mais séria da empresa, mas em superar a série de modelos do Openai.
O Google afirma que a Gemini 2.5 Pro supera seus modelos de IA de fronteira anterior e alguns dos principais modelos de IA concorrentes, em vários benchmarks. Especificamente, o Google diz que projetou o Gemini 2.5 para se destacar na criação de aplicativos da Web visualmente atraentes e aplicativos de codificação de agitação.
Em uma avaliação de edição de código de medição, chamada AIDER POLYGLOT, o Google diz que a Gemini 2.5 Pro pontuações 68,6%, superando os principais modelos de IA do OpenAI, Antrópico e Chinese AI Lab Deepseek.
No entanto, em outro teste, medindo as habilidades de desenvolvimento de software, o SWE-BECH verificado, o Gemini 2.5 Pro pontuarem 63,8%, superar o OpenAi do Openi do O3-Mini e o Deepseek R1, mas com baixo desempenho de Claude de 3,7 sonetos do Anthropic, que obteve 70,3%.
No último exame da humanidade, um teste multimodal que consiste em milhares de questões de crowdsourcing relacionadas à matemática, humanidades e ciências naturais, o Google diz que Gemini 2.5 Pro pontuações 18,8%, com desempenho melhor do que a maioria dos modelos de capital rival.
Para começar, o Google diz que a Gemini 2.5 Pro está enviando uma janela de contexto de 1 milhão de token, o que significa que o modelo de IA pode receber cerca de 750.000 palavras em uma única vez. Isso é mais longo do que toda a série de livros “Senhor dos Anéis”. E em breve, o Gemini 2.5 Pro suportará o dobro do comprimento da entrada (2 milhões de tokens).
O Google não publicou preços de API para Gemini 2.5 Pro. A empresa diz que compartilhará mais nas próximas semanas.
.








