.
A inteligência artificial está evoluindo rapidamente, e o chatbot DeepSeek AI desenvolvido na China é uma das mais novas potências em movimento. Há muito o que gostar nas respostas rápidas e detalhadas do DeepSeek, mas ele tem algumas deficiências que significam que pode não ser a ferramenta de IA que você procura.
O que é DeepSeek?
DeepSeek é uma nova potência de IA desenvolvida por uma empresa de tecnologia chinesa. Seu modelo principal, DeepSeek-V3, usa uma arquitetura exclusiva de Mixture-of-Experts (MoE). Pense nisso como uma “equipe” de sistemas de IA especializados onde apenas os especialistas mais relevantes “se ativam” para lidar com tarefas específicas, onde cada “especialista” é uma rede neural especializada.
DeepSeek afirma que seu LLM V3 foi treinado em enormes 14,8 trilhões de tokens, com um milhão de tokens equivalentes a cerca de 750.000 palavras. DeepSeek V3 também é um LLM enorme em geral, com 671 bilhões de parâmetros em sua arquitetura MoE, com 37 bilhões desses parâmetros ativados por token. Isso significa que cada prompt possui um enorme poder de processamento, com desempenho mais rápido e eficiente.
Além do mais, é um modelo de IA de código aberto, o que significa que qualquer pessoa pode explorá-lo, testá-lo e desenvolvê-lo gratuitamente. Isso o diferencia dos concorrentes que mantêm seus modelos firmemente bloqueados por acesso pago.
Colocando o DeepSeek à prova
Para ver o desempenho do DeepSeek-V3, testei-o em três tarefas práticas: escrita criativa, assistência de codificação e trabalho relacionado à produtividade. Seu desempenho demonstrou versatilidade e potência bruta, com alguns pequenos contratempos ao longo do caminho.
Tarefa 1: escrever uma descrição de personagem fictício
Pedi ao DeepSeek para escrever uma descrição detalhada de um personagem de fantasia: uma rainha rebelde liderando uma resistência contra um império do mal. A saída foi vívida e envolvente.
Tarefa 2: depurando uma função JavaScript
Testei as habilidades de codificação do DeepSeek fornecendo-lhe uma função JavaScript defeituosa que calcula o fatorial de um número. Aqui está o código com bugs que forneci:
function factorial(n) {
if (n = 1) {
return 1;
}
return n * factorial(n - 1);
}
O DeepSeek detectou instantaneamente o problema: o único sinal de igual (=) na condição estava causando um erro lógico. Ele forneceu o código corrigido e também explicou o problema:
Essa correção funcionou perfeitamente e sua explicação foi clara o suficiente para ser entendida por alguém novo em JavaScript.
Tarefa 3: Produtividade – Criando uma Agenda de Reuniões
Para um teste de produtividade, pedi ao DeepSeek que elaborasse uma agenda concisa para uma reunião da equipe de projeto sobre o lançamento de um novo produto.
DeepSeek se destacou em redação criativa, codificação e tarefas relacionadas à produtividade, fornecendo resultados sofisticados em todos os aspectos. Como acontece com qualquer ferramenta de IA, é importante revisar a precisão dos resultados, especialmente quando a precisão é importante.
O bom, o ruim e o surpreendente
Depois de testar o DeepSeek, vários pontos fortes e fracos se destacaram. Também me surpreendeu de algumas maneiras inesperadas.
DeepSeek lida com uma ampla gama de tarefas com facilidade. Desde a geração de escrita criativa vívida até a depuração de códigos complexos, ele demonstrou flexibilidade que rivaliza com os principais modelos de IA. Sua arquitetura Mixture-of-Experts faz jus ao hype, tornando o DeepSeek rápido sem sacrificar a qualidade da saída. Por exemplo, ele gerou resultados detalhados, como uma descrição de personagem ou agenda de reunião, em segundos. DeepSeek ajusta seu tom e estilo sem esforço. Seja trabalhando em documentos formais ou em redação criativa, ele adapta suas respostas à tarefa.
Como muitos modelos de IA, o DeepSeek ocasionalmente fornecia informações incorretas ou incompletas, especialmente quando questionado sobre nichos ou tópicos altamente específicos. Por exemplo, durante um teste envolvendo fatos históricos, ele deu uma resposta errada com segurança.
Embora o DeepSeek seja de código aberto, seus materiais e guias de suporte não são tão robustos quanto os de ferramentas como o GPT-4, tornando mais difícil para novos usuários maximizar seu potencial. Dada a sua origem chinesa, alguns utilizadores podem preocupar-se com a forma como os seus dados são processados ou armazenados. Embora não haja evidências que sugiram uso indevido, vale a pena considerar essas preocupações para tarefas confidenciais (o mesmo que qualquer chatbot de IA!).
Talvez o mais surpreendente seja que, para um modelo desenvolvido na China, o DeepSeek demonstrou notável fluência em culturas e perspectivas globais. Mostrou uma compreensão sofisticada de tópicos que vão desde a literatura europeia à história africana. A criatividade do DeepSeek foi outra força inesperada. Quando solicitado a fornecer uma descrição do personagem, ele não apenas forneceu uma, mas também criou um pano de fundo em torno do personagem e como ele se relaciona com outros personagens.
Os limites da conversa aberta
Dito isto, a forma como o DeepSeek lida com tópicos politicamente ou historicamente sensíveis revela limitações significativas em torno de momentos da história chinesa. Para explorar isto, perguntei sobre eventos como os protestos na Praça Tiananmen, o Grande Salto em Frente e o Massacre de Nanjing. As suas respostas destacaram uma abordagem cautelosa ou evasiva a tais assuntos.
Quando questionado sobre o incidente da Praça Tiananmen, DeepSeek recusou-se abertamente a responder.
Para efeito de comparação, o ChatGPT forneceu mais contexto em sua resposta. Abaixo está a resposta do ChatGPT:
Quando questionado sobre o Grande Salto em Frente, a explicação do DeepSeek foi breve e sem profundidade.
O ChatGPT, no entanto, ofereceu um relato mais detalhado, incluindo fatos e análises importantes. Abaixo está a resposta do ChatGPT:
A disparidade tornou-se ainda mais clara quando perguntei: Quantos civis chineses foram mortos durante o Massacre de Nanjing? Quem foi o responsável? DeepSeek desviou, evitando qualquer menção ao número estimado de mortos. Aqui está sua resposta:
Por outro lado, o ChatGPT forneceu uma estimativa, reconhecendo até a dificuldade de identificar números exatos devido às complexidades históricas. Abaixo está a resposta do ChatGPT:
Estas respostas sugerem que a DeepSeek opera dentro de limites auto-impostos, provavelmente moldados pelo seu ambiente de desenvolvimento e considerações regulamentares. Isto pode ser uma desvantagem significativa para usuários que necessitam de exploração não filtrada da história global, jornalismo ou pesquisa acadêmica.
Dito isso, para tarefas como escrita criativa, codificação ou trabalho relacionado à produtividade – onde essas limitações têm menos probabilidade de importar – o DeepSeek continua sendo um forte candidato. Em última análise, se esta é a ferramenta certa depende de quanta transparência e abertura você precisa em um assistente de IA.
.







