O início surge da furtividade com um novo tipo de modelo de IA

Começouma nova empresa com sede em Palo Alto, iniciada pelo professor de ciência da computação de Stanford, Stefano Ermon, afirma ter desenvolvido um novo modelo de IA baseado na tecnologia de “difusão”. O INCECTION chama isso de um modelo de linguagem grande baseado em difusão, ou um “DLM” para abreviar.

Os modelos generativos de IA que recebem mais atenção agora podem ser amplamente divididos em dois tipos: modelos de idiomas grandes (LLMs) e modelos de difusão. LLMS, construído no Arquitetura do transformadorsão usados para geração de texto. Enquanto isso, os modelos de difusão, que alimentam sistemas de IA como Midjourney e Sora de Openai, são usados principalmente para criar imagens, vídeo e áudio.

O modelo da Início oferece os recursos dos LLMs tradicionais, incluindo geração de código e resposta à pergunta, mas com desempenho significativamente mais rápido e custos de computação reduzidos, de acordo com a empresa.

Ermon disse ao Strong The One que estuda como aplicar modelos de difusão ao texto há muito tempo em seu laboratório de Stanford. Sua pesquisa foi baseada na idéia de que os LLMs tradicionais são relativamente lentos em comparação com a tecnologia de difusão.

Com o LLMS, “você não pode gerar a segunda palavra até gerar o primeiro e não pode gerar o terceiro até gerar os dois primeiros”, disse Ermon.

Ermon estava procurando uma maneira de aplicar uma abordagem de difusão ao texto, porque, diferentemente do LLMS, que funcionam sequencialmente, os modelos de difusão começam com uma estimativa aproximada dos dados que eles estão gerando (por exemplo, uma imagem) e, em seguida, trazer os dados em foco de uma só vez.

Ermon levantou a geração e a modificação de grandes blocos de texto em paralelo foi possível com modelos de difusão. Depois de anos de tentativa, Ermon e um aluno de seu alcançaram um grande avanço, que eles detalhavam em um Trabalho de pesquisa publicado no ano passado.

Reconhecendo o potencial do avanço, Ermon fundou o início no verão passado, explorando dois ex-alunos, a professora da UCLA Aditya Grover e a professora de Cornell Volodymyr Kulesohov, para co-liderar a empresa.

Enquanto Ermon se recusou a discutir o financiamento da Inception, o Strong The One entende que o Mayfield Fund investiu.

O início já garantiu vários clientes, incluindo empresas da Fortune 100 sem nome, atendendo à sua necessidade crítica de redução da latência da IA e aumento da velocidade, disse Emron.

“O que descobrimos é que nossos modelos podem aproveitar as GPUs com muito mais eficiência”, disse Ermon, referindo -se aos chips de computador comumente usados para executar modelos na produção. “Eu acho que isso é realmente um grande negócio, porque acho que isso vai mudar a maneira como as pessoas constroem modelos de linguagem”.

A INCCECTION oferece uma API, bem como opções de implantação de dispositivos de ponta, suporte para o ajuste fino do modelo e um conjunto de DLMs prontos para uso para vários casos de uso. A empresa afirma que seus DLMs podem correr até 10x mais rápido que os LLMs tradicionais, custando 10x a menos.

“Nosso modelo de codificação ‘pequeno’ é tão bom quanto [OpenAI’s] GPT-4O Mini, enquanto mais de 10 vezes mais rápido ”, disse um porta-voz da empresa ao Strong The One. “Nosso modelo ‘mini’ supera pequenos modelos de código aberto como [Meta’s] Llama 3,1 8b e alcança mais de 1.000 fichas por segundo. ”

“Tokens” é a linguagem do setor para bits de dados brutos. Mil tokens por segundo é Uma velocidade impressionante de fatoassumindo as reivindicações de Inception se sustentam.

Etiquetas

Astafevereiro 26, 2025

0 2 minutos de leitura

Mostrar mais

Ler o Próximo

O início surge da furtividade com um novo tipo de modelo de IA

Asta

Ler o Próximo

Não bloqueado arrecada US $ 20 milhões para a IA para ajudar os desenvolvedores a entender as bases de código

A Newlimit, fundada pelo CEO da Coinbase, Brian Armstrong, arrecada US $ 130 milhões para desenvolver tratamentos de reversão da idade

O Google estreia um modelo atualizado Gemini 2.5 Pro Ai antes da E/S

A relevância da IA levanta US $ 24 milhões para ajudar as empresas a criar agentes de IA

O novo Surface Pro da Microsoft é menor, mais leve e mais amigável

Impulsionado pela Defesa e Starlink, Orca AI recebe US $ 72,5 milhões para sua plataforma de remessa autônoma

O que é AI Mistral? Tudo para saber sobre o concorrente Openai

Anduril está trabalhando na difícil tarefa relacionada à IA da computação de borda em tempo real

O Google revela acidentalmente detalhes sobre sua nova linguagem de design Android, material 3 expressivo

As pessoas lutam para obter conselhos úteis para a saúde dos chatbots, o estudo encontra

Não bloqueado arrecada US $ 20 milhões para a IA para ajudar os desenvolvedores a entender as bases de código

A Newlimit, fundada pelo CEO da Coinbase, Brian Armstrong, arrecada US $ 130 milhões para desenvolver tratamentos de reversão da idade

O Google estreia um modelo atualizado Gemini 2.5 Pro Ai antes da E/S

A relevância da IA levanta US $ 24 milhões para ajudar as empresas a criar agentes de IA

O novo Surface Pro da Microsoft é menor, mais leve e mais amigável

Impulsionado pela Defesa e Starlink, Orca AI recebe US $ 72,5 milhões para sua plataforma de remessa autônoma

O que é AI Mistral? Tudo para saber sobre o concorrente Openai

Anduril está trabalhando na difícil tarefa relacionada à IA da computação de borda em tempo real

O Google revela acidentalmente detalhes sobre sua nova linguagem de design Android, material 3 expressivo

As pessoas lutam para obter conselhos úteis para a saúde dos chatbots, o estudo encontra

Deixe um comentário Cancelar resposta

Ler o Próximo

Não bloqueado arrecada US $ 20 milhões para a IA para ajudar os desenvolvedores a entender as bases de código

A Newlimit, fundada pelo CEO da Coinbase, Brian Armstrong, arrecada US $ 130 milhões para desenvolver tratamentos de reversão da idade

O Google estreia um modelo atualizado Gemini 2.5 Pro Ai antes da E/S

A relevância da IA ​​levanta US $ 24 milhões para ajudar as empresas a criar agentes de IA

O novo Surface Pro da Microsoft é menor, mais leve e mais amigável

Impulsionado pela Defesa e Starlink, Orca AI recebe US $ 72,5 milhões para sua plataforma de remessa autônoma

O que é AI Mistral? Tudo para saber sobre o concorrente Openai

Anduril está trabalhando na difícil tarefa relacionada à IA da computação de borda em tempo real

O Google revela acidentalmente detalhes sobre sua nova linguagem de design Android, material 3 expressivo

As pessoas lutam para obter conselhos úteis para a saúde dos chatbots, o estudo encontra

Artigos relacionados

Deixe um comentário Cancelar resposta

A relevância da IA levanta US $ 24 milhões para ajudar as empresas a criar agentes de IA