Ciência e Tecnologia

Antrópica lança um novo modelo de IA que ‘pensa’ enquanto você quiser

.

A Anthropic está lançando um novo modelo de AI de fronteira chamado Claude 3,7 sonetos, que a empresa projetou para “pensar” sobre perguntas enquanto os usuários desejam.

O Antrópico chama Claude 3,7 soneto do primeiro “modelo híbrido de raciocínio híbrido de IA”, porque é um modelo único que pode fornecer respostas em tempo real e mais consideradas, respostas “pensadas” às perguntas. Os usuários podem escolher se devem ativar as habilidades de “raciocínio” do modelo de IA, que levam Claude 3,7 sonetos a “pensar” por um curto ou longo período de tempo.

O modelo representa um esforço mais amplo da Anthropic para simplificar a experiência do usuário em torno de seus produtos de IA. Hoje, a maioria dos chatbots da AI possui um seletor de modelo assustador que obriga os usuários a escolher entre várias opções diferentes que variam em custo e capacidade. Laboratórios como antropia preferem que você não precise pensar sobre isso – idealmente, um modelo faz todo o trabalho.

Claude 3,7 Sonnet está sendo lançado para todos os usuários e desenvolvedores na segunda -feira, disse o Anthrópio, mas apenas as pessoas que pagam pelos planos de chatbot Claude Claude do Antrópico terão acesso aos recursos de raciocínio do modelo. Os usuários gratuitos do Claude obtiverão a versão padrão e não raciocínio do Claude 3,7 sonetos, que reivindicações antropis supera seu modelo anterior de Frontier AI, Claude 3,5 sonetos. (Sim, a empresa pulou um número.)

Claude 3,7 soneto custa US $ 3 por milhão de tokens de entrada (o que significa que você pode entrar em aproximadamente 750.000 palavras, mais palavras do que toda a série “Senhor dos Anéis”, em Claude por US $ 3) e US $ 15 por milhão de tokens de produção. Isso o torna mais caro que o O3-mini da OpenAI (US $ 1,10 por 1 milhão de tokens de entrada/US $ 4,40 por 1 milhão de tokens de saída) e R1 de Deepseek (55 centavos por 1 milhão de tokens de entrada/US $ 2,19 por 1 milhão de tokens de saída), mas lembre O3-mini e R1 são modelos estritamente raciocínio-não híbridos como Claude 3,7 sonetos.

Novos modos de pensamento do antropic Créditos da imagem:Antrópico

Claude 3,7 Sonnet é o primeiro modelo de IA do Antrópico que pode “raciocinar”, uma técnica que muitos laboratórios de IA recorreram à medida que os métodos tradicionais de melhorar a AI Performance diminuem.

Modelos de raciocínio como O3-mini, R1, Gemini 2.0 Flash pensamento do Google e GROK 3 (pense) do Google usam mais tempo e poder de computação antes de responder a perguntas. Os modelos dividem os problemas em etapas menores, o que tende a melhorar a precisão da resposta final. Os modelos de raciocínio não estão pensando ou raciocínio como um humano, necessariamente, mas o processo deles é modelado após a dedução.

Eventualmente, o Antrópico gostaria de Claude descobrir quanto tempo deve “pensar” sobre perguntas por conta própria, sem precisar dos usuários para selecionar controles com antecedência, disse o Strong The One de produto e pesquisa de produtos e pesquisas da Anthrópica, Dianne Penn, em entrevista.

“Semelhante a como os humanos não têm dois cérebros separados para perguntas que podem ser respondidas imediatamente versus aquelas que exigem pensamento”, escreveu Anthropic em um Postagem do blog Compartilhado com o Strong The One, “Consideramos o raciocínio simplesmente um dos recursos que um modelo de fronteira deve ter, para ser suavemente integrado a outros recursos, em vez de algo a ser fornecido em um modelo separado”.

A Anthrópica diz que está permitindo que Claude 3,7 soneto mostre sua fase de planejamento interno através de uma “almofada de arranhões visíveis”. Penn disse aos usuários do Strong The One verão o processo de pensamento completo de Claude para a maioria das instruções, mas que algumas partes podem ser redigidas para fins de confiança e segurança.

Processo de pensamento de Claude no aplicativo Claude Créditos da imagem:Antrópico

A Anthrópica diz que otimizou os modos de pensamento de Claude para tarefas do mundo real, como problemas difíceis de codificação ou tarefas agênticas. Os desenvolvedores que tocam a API da Antrópico podem controlar o “orçamento” para pensar, velocidade de negociação e custo para a qualidade da resposta.

Em um teste para medir tarefas de codificação de palavras reais, o SWE-banch, o Claude 3,7 sonetos foi preciso 62,3%, em comparação com o modelo O3-mini da OpenAI, que obteve 49,3%. Em outro teste, para medir a capacidade de um modelo de IA de interagir com usuários simulados e APIs externas em um ambiente de varejo, o banco Tau, o Claude 3,7 sonetos obteve 81,2%, em comparação com o modelo O1 do OpenAI, que obteve 73,5%.

A Anthropic também diz que o Claude 3,7 soneto se recusará a responder a perguntas com menos frequência do que seus modelos anteriores, alegando que o modelo é capaz de fazer distinções mais sutis entre avisos prejudiciais e benignos. O Antrópico diz que reduziu as recusas desnecessárias em 45% em comparação com Claude 3,5 sonetos. Isso ocorre no momento em que alguns outros laboratórios de IA estão repensando sua abordagem para restringir as respostas de seus chatbot de IA.

Além do soneto Claude 3,7, o Antrópico também está lançando uma ferramenta de codificação agêntica chamada CAUDE CÓDIGO. Lançando como uma visualização de pesquisa, a ferramenta permite que os desenvolvedores executem tarefas específicas através do Claude diretamente do seu terminal.

Em uma demonstração, funcionários antrópicos mostraram como o código Claude pode analisar um projeto de codificação com um comando simples como, ““Explique esta estrutura do projeto. ” Usando inglês simples na linha de comando, um desenvolvedor pode modificar uma base de código. O código Claude descreverá suas edições, pois faz alterações e até testará um projeto para erros ou o empurrará para um repositório do GitHub.

O código de Claude estará inicialmente disponível para um número limitado de usuários, com base no Strong The One.

O Anthropic está lançando Claude 3,7 sonetos no momento em que a AI Labs está enviando novos modelos de IA em um ritmo vertiginoso. Historicamente, antrópico adotou uma abordagem mais metódica e focada na segurança. Mas desta vez, a empresa está procurando liderar o pacote.

Por quanto tempo, porém, é a questão. O OpenAI pode estar perto de liberar um modelo híbrido de IA próprio; O CEO da empresa, Sam Altman, disse que chegará em “meses”.

.

Mostrar mais

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo