O aplicativo Huggingsnap serve a melhor ferramenta de IA da Apple, com uma reviravolta conveniente

A plataforma de aprendizado de máquina, Hugging Face, lançou um aplicativo iOS que dará sentido ao mundo ao seu redor, como visto pela câmera do seu iPhone. Apenas aponte para uma cena ou clique em uma imagem e ele implantará uma IA para descrevê-la, identificar objetos, executar a tradução ou puxar detalhes baseados em texto.

Nomeado Huggingsnap, o aplicativo adota uma abordagem de vários modelos para entender a cena ao seu redor como uma entrada e agora está disponível gratuitamente na App Store. É alimentado pelo smolvlm2, um modelo de IA aberto que pode lidar com texto, imagem e vídeo como formatos de entrada.

O objetivo abrangente do aplicativo é permitir que as pessoas aprendam sobre os objetos e o cenário ao seu redor, incluindo reconhecimento de plantas e animais. A idéia não é muito diferente da inteligência visual nos iPhones, mas o Huggingsnap tem uma vantagem crucial sobre seu rival da Apple.

Ative o JavaScript para visualizar este conteúdo

Não exige que a internet funcione

Tudo o que precisa é de um iPhone executando o iOS 18 e você está pronto para ir. A interface do usuário do Huggingsnap não é muito diferente do que você recebe com a inteligência visual. Mas há uma diferença fundamental aqui.

A Apple depende do ChatGPT para que a inteligência visual funcione. Isso ocorre porque atualmente não é capaz de agir como uma ferramenta de IA generativa, como ChatGPT ou Gemini do Google, ambos com seu próprio banco de conhecimento. Em vez disso, ele descarrega todas essas solicitações e consultas de usuário para ChatGPT.

Isso requer uma conexão com a Internet, pois o ChatGPT não pode funcionar no modo offline. Huggingsnap, por outro lado, funciona muito bem. Além disso, uma abordagem offline significa que nenhum dados do usuário sai do seu telefone, o que é sempre uma mudança bem -vinda de uma perspectiva de privacidade.

O que você pode fazer com Huggingsnap?

Huggingsnap Identificando a garrafa de perfume. — Nadeem Sarwar / Digital Trends

Huggingsnap é alimentado pelo modelo SMOLVLM2 desenvolvido abraçando o rosto. Então, o que esse modelo executando o programa por trás deste aplicativo pode realizar? Bem, muito. Além de responder perguntas com base no que ele vê através da câmera de um iPhone, ele também pode processar imagens escolhidas na galeria do seu telefone.

Por exemplo, mostre uma foto de qualquer monumento histórico e peça para lhe dar sugestões de viagem. Ele pode entender as coisas que aparecem em um gráfico ou entender as perguntas e as perguntas de resposta de uma conta de eletricidade com base nos detalhes que ele recebeu no documento.

Possui uma arquitetura leve e é particularmente adequada para aplicações de IA no dispositivo. Nos benchmarks, ele tem um desempenho melhor do que o modelo de paligemma aberto (3B) concorrente do Google e esfrega os ombros com o modelo rival Qwen AI da Alibaba com recursos de visão.

Executando o aplicativo Huggingsnap no iPhone. — Nadeem Sarwar / Digital Trends

A maior vantagem é que ele requer menos recursos do sistema para executar, o que é particularmente importante no contexto dos smartphones. Curiosamente, o popular Media Player VLC também está usando o mesmo modelo SMOLVLM2 para fornecer descrições de vídeo, permitindo que os usuários pesquisem em um vídeo usando prompts de linguagem natural.

Também pode extrair de maneira inteligente os momentos de destaque mais importantes de um vídeo. “Projetado para eficiência, o SMOLVLM pode responder a perguntas sobre imagens, descrever conteúdo visual, criar histórias fundamentadas em várias imagens ou funcionar como um modelo de linguagem pura sem entradas visuais”, diz o repositório do Github do aplicativo.

Etiquetas

Strongmarço 20, 2025

0 2 minutos de leitura

Mostrar mais

Ler o Próximo

O aplicativo Huggingsnap serve a melhor ferramenta de IA da Apple, com uma reviravolta conveniente

Não exige que a internet funcione

O que você pode fazer com Huggingsnap?

Strong

Ler o Próximo

Não bloqueado arrecada US $ 20 milhões para a IA para ajudar os desenvolvedores a entender as bases de código

A Newlimit, fundada pelo CEO da Coinbase, Brian Armstrong, arrecada US $ 130 milhões para desenvolver tratamentos de reversão da idade

O Google estreia um modelo atualizado Gemini 2.5 Pro Ai antes da E/S

A relevância da IA levanta US $ 24 milhões para ajudar as empresas a criar agentes de IA

O novo Surface Pro da Microsoft é menor, mais leve e mais amigável

Impulsionado pela Defesa e Starlink, Orca AI recebe US $ 72,5 milhões para sua plataforma de remessa autônoma

O que é AI Mistral? Tudo para saber sobre o concorrente Openai

Anduril está trabalhando na difícil tarefa relacionada à IA da computação de borda em tempo real

O Google revela acidentalmente detalhes sobre sua nova linguagem de design Android, material 3 expressivo

As pessoas lutam para obter conselhos úteis para a saúde dos chatbots, o estudo encontra

Não bloqueado arrecada US $ 20 milhões para a IA para ajudar os desenvolvedores a entender as bases de código

A Newlimit, fundada pelo CEO da Coinbase, Brian Armstrong, arrecada US $ 130 milhões para desenvolver tratamentos de reversão da idade

O Google estreia um modelo atualizado Gemini 2.5 Pro Ai antes da E/S

A relevância da IA levanta US $ 24 milhões para ajudar as empresas a criar agentes de IA

O novo Surface Pro da Microsoft é menor, mais leve e mais amigável

Impulsionado pela Defesa e Starlink, Orca AI recebe US $ 72,5 milhões para sua plataforma de remessa autônoma

O que é AI Mistral? Tudo para saber sobre o concorrente Openai

Anduril está trabalhando na difícil tarefa relacionada à IA da computação de borda em tempo real

O Google revela acidentalmente detalhes sobre sua nova linguagem de design Android, material 3 expressivo

As pessoas lutam para obter conselhos úteis para a saúde dos chatbots, o estudo encontra

Deixe um comentário Cancelar resposta

Não exige que a internet funcione

O que você pode fazer com Huggingsnap?

Ler o Próximo

Não bloqueado arrecada US $ 20 milhões para a IA para ajudar os desenvolvedores a entender as bases de código

A Newlimit, fundada pelo CEO da Coinbase, Brian Armstrong, arrecada US $ 130 milhões para desenvolver tratamentos de reversão da idade

O Google estreia um modelo atualizado Gemini 2.5 Pro Ai antes da E/S

A relevância da IA ​​levanta US $ 24 milhões para ajudar as empresas a criar agentes de IA

O novo Surface Pro da Microsoft é menor, mais leve e mais amigável

Impulsionado pela Defesa e Starlink, Orca AI recebe US $ 72,5 milhões para sua plataforma de remessa autônoma

O que é AI Mistral? Tudo para saber sobre o concorrente Openai

Anduril está trabalhando na difícil tarefa relacionada à IA da computação de borda em tempo real

O Google revela acidentalmente detalhes sobre sua nova linguagem de design Android, material 3 expressivo

As pessoas lutam para obter conselhos úteis para a saúde dos chatbots, o estudo encontra

Artigos relacionados

Deixe um comentário Cancelar resposta

A relevância da IA levanta US $ 24 milhões para ajudar as empresas a criar agentes de IA