Deepseek tem um novo rival, e você pode experimentar agora

O Alibaba acaba de revelar seu mais recente modelo de raciocínio, e parece que o Deepseek e o Openai podem ter algo com o que se preocupar – pelo menos se todas as promessas do Alibaba forem verdadeiras. É fonte aberta, então eu verifiquei. Você também pode experimentar de graça, embora sem surpresa, você descobrirá que há algumas coisas sobre as quais não falam com você.

O novo modelo, apelidado de QWQ-32B (Quan-With-Questions) funciona com muito menos parâmetros, o que significa que requer menos recursos, mas o Alibaba afirma que ele tem desempenho no mesmo nível que o DeepSeek ou o OpenAi da O1-Mini.

O Modelo de Linguagem R1 R1 (LLM) da Deepseek foi toda a raiva no início de fevereiro, quando foi lançado, de repente capaz de rivalizar com o Golden Standard estabelecido pelo ChatGPT e outras alternativas, mas a um custo muito menor. Parece que o Alibaba pode estar empurrando o envelope ainda mais aqui.

Deepseek AI correndo em um iPhone. — Nadeem Sarwar / Trends Digital

Conforme explicado pelo VentureBeat, o Deepseek-R1 requer 671 bilhões de parâmetros para executar, dos quais 37 bilhões são ativados. Enquanto isso, o novo QWQ-32B do Alibaba pode obter por 32 bilhões de parâmetros. Esses números são totalmente abstratos para muitos, mas há uma enorme diferença no poder de computação; Enquanto o Deepseek R1 exige que 1600 GB de VRAM sejam executados, o QWQ-32B pode sobreviver com apenas 24 GB de VRAM. Na maioria dos casos, isso significará o H100 ou equivalentes da NVIDIA, mas mesmo o RTX 4090 focado nos jogos exibe 24 GB. O mais recente RTX 5090 UPS, para 32 GB.

O QWQ-32B da Alibaba está disponível sob uma licença Apache 2.0, o que significa que empresas e pesquisadores podem usá-la. Mais importante, nós Pode usá -lo experimentando o Chat Qwen do Alibaba. Como o Deepseek, ele vem com algumas limitações, mas também tem algumas vantagens imediatas que notei rapidamente.

Parece dar respostas bastante detalhadas, mesmo para perguntas rápidas e simples. Isso pode ser bom, mas de certa forma, foi principalmente irritante, pois oferece muito contexto desnecessário que você não pediu. Eu gosto que isso mostra todo o seu processo de raciocínio, que é semelhante ao recurso de pensamento profundo do ChatGPT – mas com muito menos profundidade.

Quando perguntado sobre questões políticas, Qwen Chat sinaliza como inapropriado. Afinal, pode haver maneiras de jailbreak – era possível com a Deepseek – mas ainda não consegui.

Ainda não se sabe se as reivindicações de Alibaba são verdadeiras, mas parece que o ChatGPT e o Deepseek agora têm um novo rival.

Etiquetas

Strongmarço 6, 2025

0 2 minutos de leitura

Mostrar mais

Ler o Próximo

Deepseek tem um novo rival, e você pode experimentar agora

Strong

Ler o Próximo

Não bloqueado arrecada US $ 20 milhões para a IA para ajudar os desenvolvedores a entender as bases de código

A Newlimit, fundada pelo CEO da Coinbase, Brian Armstrong, arrecada US $ 130 milhões para desenvolver tratamentos de reversão da idade

O Google estreia um modelo atualizado Gemini 2.5 Pro Ai antes da E/S

A relevância da IA levanta US $ 24 milhões para ajudar as empresas a criar agentes de IA

O novo Surface Pro da Microsoft é menor, mais leve e mais amigável

Impulsionado pela Defesa e Starlink, Orca AI recebe US $ 72,5 milhões para sua plataforma de remessa autônoma

O que é AI Mistral? Tudo para saber sobre o concorrente Openai

Anduril está trabalhando na difícil tarefa relacionada à IA da computação de borda em tempo real

O Google revela acidentalmente detalhes sobre sua nova linguagem de design Android, material 3 expressivo

As pessoas lutam para obter conselhos úteis para a saúde dos chatbots, o estudo encontra

Não bloqueado arrecada US $ 20 milhões para a IA para ajudar os desenvolvedores a entender as bases de código

A Newlimit, fundada pelo CEO da Coinbase, Brian Armstrong, arrecada US $ 130 milhões para desenvolver tratamentos de reversão da idade

O Google estreia um modelo atualizado Gemini 2.5 Pro Ai antes da E/S

A relevância da IA levanta US $ 24 milhões para ajudar as empresas a criar agentes de IA

O novo Surface Pro da Microsoft é menor, mais leve e mais amigável

Impulsionado pela Defesa e Starlink, Orca AI recebe US $ 72,5 milhões para sua plataforma de remessa autônoma

O que é AI Mistral? Tudo para saber sobre o concorrente Openai

Anduril está trabalhando na difícil tarefa relacionada à IA da computação de borda em tempo real

O Google revela acidentalmente detalhes sobre sua nova linguagem de design Android, material 3 expressivo

As pessoas lutam para obter conselhos úteis para a saúde dos chatbots, o estudo encontra

Deixe um comentário Cancelar resposta

Ler o Próximo

Não bloqueado arrecada US $ 20 milhões para a IA para ajudar os desenvolvedores a entender as bases de código

A Newlimit, fundada pelo CEO da Coinbase, Brian Armstrong, arrecada US $ 130 milhões para desenvolver tratamentos de reversão da idade

O Google estreia um modelo atualizado Gemini 2.5 Pro Ai antes da E/S

A relevância da IA ​​levanta US $ 24 milhões para ajudar as empresas a criar agentes de IA

O novo Surface Pro da Microsoft é menor, mais leve e mais amigável

Impulsionado pela Defesa e Starlink, Orca AI recebe US $ 72,5 milhões para sua plataforma de remessa autônoma

O que é AI Mistral? Tudo para saber sobre o concorrente Openai

Anduril está trabalhando na difícil tarefa relacionada à IA da computação de borda em tempo real

O Google revela acidentalmente detalhes sobre sua nova linguagem de design Android, material 3 expressivo

As pessoas lutam para obter conselhos úteis para a saúde dos chatbots, o estudo encontra

Artigos relacionados

Deixe um comentário Cancelar resposta

A relevância da IA levanta US $ 24 milhões para ajudar as empresas a criar agentes de IA