.
O Alibaba acaba de revelar seu mais recente modelo de raciocínio, e parece que o Deepseek e o Openai podem ter algo com o que se preocupar – pelo menos se todas as promessas do Alibaba forem verdadeiras. É fonte aberta, então eu verifiquei. Você também pode experimentar de graça, embora sem surpresa, você descobrirá que há algumas coisas sobre as quais não falam com você.
O novo modelo, apelidado de QWQ-32B (Quan-With-Questions) funciona com muito menos parâmetros, o que significa que requer menos recursos, mas o Alibaba afirma que ele tem desempenho no mesmo nível que o DeepSeek ou o OpenAi da O1-Mini.
O Modelo de Linguagem R1 R1 (LLM) da Deepseek foi toda a raiva no início de fevereiro, quando foi lançado, de repente capaz de rivalizar com o Golden Standard estabelecido pelo ChatGPT e outras alternativas, mas a um custo muito menor. Parece que o Alibaba pode estar empurrando o envelope ainda mais aqui.

Conforme explicado pelo VentureBeat, o Deepseek-R1 requer 671 bilhões de parâmetros para executar, dos quais 37 bilhões são ativados. Enquanto isso, o novo QWQ-32B do Alibaba pode obter por 32 bilhões de parâmetros. Esses números são totalmente abstratos para muitos, mas há uma enorme diferença no poder de computação; Enquanto o Deepseek R1 exige que 1600 GB de VRAM sejam executados, o QWQ-32B pode sobreviver com apenas 24 GB de VRAM. Na maioria dos casos, isso significará o H100 ou equivalentes da NVIDIA, mas mesmo o RTX 4090 focado nos jogos exibe 24 GB. O mais recente RTX 5090 UPS, para 32 GB.
O QWQ-32B da Alibaba está disponível sob uma licença Apache 2.0, o que significa que empresas e pesquisadores podem usá-la. Mais importante, nós Pode usá -lo experimentando o Chat Qwen do Alibaba. Como o Deepseek, ele vem com algumas limitações, mas também tem algumas vantagens imediatas que notei rapidamente.
Parece dar respostas bastante detalhadas, mesmo para perguntas rápidas e simples. Isso pode ser bom, mas de certa forma, foi principalmente irritante, pois oferece muito contexto desnecessário que você não pediu. Eu gosto que isso mostra todo o seu processo de raciocínio, que é semelhante ao recurso de pensamento profundo do ChatGPT – mas com muito menos profundidade.
Quando perguntado sobre questões políticas, Qwen Chat sinaliza como inapropriado. Afinal, pode haver maneiras de jailbreak – era possível com a Deepseek – mas ainda não consegui.
Ainda não se sabe se as reivindicações de Alibaba são verdadeiras, mas parece que o ChatGPT e o Deepseek agora têm um novo rival.
.







