Ciência e Tecnologia

O início surge da furtividade com um novo tipo de modelo de IA

.

Começouma nova empresa com sede em Palo Alto, iniciada pelo professor de ciência da computação de Stanford, Stefano Ermon, afirma ter desenvolvido um novo modelo de IA baseado na tecnologia de “difusão”. O INCECTION chama isso de um modelo de linguagem grande baseado em difusão, ou um “DLM” para abreviar.

Os modelos generativos de IA que recebem mais atenção agora podem ser amplamente divididos em dois tipos: modelos de idiomas grandes (LLMs) e modelos de difusão. LLMS, construído no Arquitetura do transformadorsão usados ​​para geração de texto. Enquanto isso, os modelos de difusão, que alimentam sistemas de IA como Midjourney e Sora de Openai, são usados ​​principalmente para criar imagens, vídeo e áudio.

O modelo da Início oferece os recursos dos LLMs tradicionais, incluindo geração de código e resposta à pergunta, mas com desempenho significativamente mais rápido e custos de computação reduzidos, de acordo com a empresa.

Ermon disse ao Strong The One que estuda como aplicar modelos de difusão ao texto há muito tempo em seu laboratório de Stanford. Sua pesquisa foi baseada na idéia de que os LLMs tradicionais são relativamente lentos em comparação com a tecnologia de difusão.

Com o LLMS, “você não pode gerar a segunda palavra até gerar o primeiro e não pode gerar o terceiro até gerar os dois primeiros”, disse Ermon.

Ermon estava procurando uma maneira de aplicar uma abordagem de difusão ao texto, porque, diferentemente do LLMS, que funcionam sequencialmente, os modelos de difusão começam com uma estimativa aproximada dos dados que eles estão gerando (por exemplo, uma imagem) e, em seguida, trazer os dados em foco de uma só vez.

Ermon levantou a geração e a modificação de grandes blocos de texto em paralelo foi possível com modelos de difusão. Depois de anos de tentativa, Ermon e um aluno de seu alcançaram um grande avanço, que eles detalhavam em um Trabalho de pesquisa publicado no ano passado.

Reconhecendo o potencial do avanço, Ermon fundou o início no verão passado, explorando dois ex-alunos, a professora da UCLA Aditya Grover e a professora de Cornell Volodymyr Kulesohov, para co-liderar a empresa.

Enquanto Ermon se recusou a discutir o financiamento da Inception, o Strong The One entende que o Mayfield Fund investiu.

O início já garantiu vários clientes, incluindo empresas da Fortune 100 sem nome, atendendo à sua necessidade crítica de redução da latência da IA ​​e aumento da velocidade, disse Emron.

“O que descobrimos é que nossos modelos podem aproveitar as GPUs com muito mais eficiência”, disse Ermon, referindo -se aos chips de computador comumente usados ​​para executar modelos na produção. “Eu acho que isso é realmente um grande negócio, porque acho que isso vai mudar a maneira como as pessoas constroem modelos de linguagem”.

A INCCECTION oferece uma API, bem como opções de implantação de dispositivos de ponta, suporte para o ajuste fino do modelo e um conjunto de DLMs prontos para uso para vários casos de uso. A empresa afirma que seus DLMs podem correr até 10x mais rápido que os LLMs tradicionais, custando 10x a menos.

“Nosso modelo de codificação ‘pequeno’ é tão bom quanto [OpenAI’s] GPT-4O Mini, enquanto mais de 10 vezes mais rápido ”, disse um porta-voz da empresa ao Strong The One. “Nosso modelo ‘mini’ supera pequenos modelos de código aberto como [Meta’s] Llama 3,1 8b e alcança mais de 1.000 fichas por segundo. ”

“Tokens” é a linguagem do setor para bits de dados brutos. Mil tokens por segundo é Uma velocidade impressionante de fatoassumindo as reivindicações de Inception se sustentam.

.

Mostrar mais

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo