.
Quando a OpenAI anunciou o GPT-4, seu mais recente modelo de linguagem grande, em março passado, ela enviou ondas de choque pelo mundo da tecnologia. Era claramente mais capaz do que qualquer coisa vista antes em conversar, programar e resolver todos os tipos de problemas espinhosos – incluindo trabalhos de casa escolares.
Antrópico, rival do OpenAI, anunciou hoje que fez seu próprio avanço de IA que atualizará chatbots e outros casos de uso. Mas embora o novo modelo seja o melhor do mundo em alguns aspectos, é mais um passo em frente do que um grande salto.
O novo modelo da Antrópico, denominado Claude 3.5 Sonnet, é uma atualização de sua família existente de modelos de IA Claude 3. É mais hábil em resolver problemas de matemática, codificação e lógica, conforme medido por benchmarks comumente usados. A Anthropic diz que também é muito mais rápido, entende melhor as nuances da linguagem e ainda tem melhor senso de humor.
Isso é sem dúvida útil para pessoas que tentam criar aplicativos e serviços com base nos modelos de IA da Anthropic. Mas as notícias da empresa também são um lembrete de que o mundo ainda está esperando por outro salto em IA semelhante ao fornecido pelo GPT-4.
A expectativa vem crescendo para que a OpenAI lance uma sequência chamada GPT-5 há mais de um ano, e o CEO da empresa, Sam Altman, encorajou a especulação que proporcionará outra revolução nas capacidades de IA. O treinamento do GPT-4 custou mais de US$ 100 milhões, e espera-se que o GPT-5 seja muito maior e mais caro.
Embora OpenAI, Google e outros desenvolvedores de IA tenham lançado novos modelos que superam o GPT-4, o mundo ainda está esperando pelo próximo grande salto. Ultimamente, o progresso na IA tornou-se mais incremental e mais dependente de inovações no design e treinamento de modelos, em vez do dimensionamento de força bruta do tamanho do modelo e da computação, como fez o GPT-4.
Michael Gerstenhaber, chefe de produto da Anthropic, diz que o novo modelo Claude 3.5 Sonnet da empresa é maior que o seu antecessor, mas extrai grande parte da sua nova competência de inovações em treinamento. Por exemplo, o modelo recebeu feedback destinado a melhorar suas habilidades de raciocínio lógico.
A Anthropic afirma que Claude 3.5 Sonnet supera os melhores modelos da OpenAI, Google e Facebook em benchmarks populares de IA, incluindo GPQAum teste de especialização em biologia, física e química em nível de pós-graduação; MMLU, um teste que abrange ciência da computação, história e outros tópicos; e Avaliação Humana, uma medida de proficiência em codificação. As melhorias são uma questão de alguns pontos percentuais.
Este último progresso em IA pode não ser revolucionário, mas é acelerado: apenas antrópico anunciado sua geração anterior de modelos há três meses. “Se observarmos a taxa de mudança na inteligência, perceberemos a rapidez com que estamos avançando”, diz Gerstenhaber.
Mais de um ano depois de o GPT-4 ter estimulado um frenesim de novos investimentos em IA, pode estar a revelar-se mais difícil produzir novos grandes saltos em inteligência de máquina. Com o GPT-4 e modelos semelhantes treinados em grandes quantidades de texto, imagens e vídeos on-line, está ficando mais difícil encontrar novas fontes de dados para alimentar algoritmos de aprendizado de máquina. Espera-se que tornar modelos substancialmente maiores, para que tenham mais capacidade de aprendizagem, custe milhares de milhões de dólares. Quando a OpenAI anunciou sua recente atualização no mês passado, com um modelo que possui recursos visuais e de voz chamado GPT-4o, o foco estava em uma interface mais natural e humana, em vez de habilidades de resolução de problemas substancialmente mais inteligentes.
.