Ciência e Tecnologia

Bilionário apoiado por Softbank para investir US $ 230 milhões na startup indiana da IA ​​Krutrim

.

O fundador da OLA, Bhavish Aggarwal, está investindo US $ 230 milhões em uma startup de IA que ele fundou enquanto o país pressiona para se estabelecer em um campo dominado por empresas americanas e chinesas.

Aggarwal está financiando o investimento em Krutrim – que vem construindo grandes modelos de idiomas (LLMS) para idiomas indianos – principalmente por meio de seu escritório de família, uma fonte familiarizada com o assunto disse ao Strong The One. Em uma postagem em x Terça -feira, Aggarwal disse que Krutrim procura atrair um investimento de US $ 1,15 bilhão no próximo ano. Ele procurará aumentar o restante da capital de investidores externos, disse a fonte.

O anúncio de financiamento coincide com a startup da Unicorn Krutrim, fazendo seus modelos de IA em código aberto e revelando planos para construir o que afirma ser o maior supercomputador da Índia em parceria com a NVIDIA.

O laboratório Liberou Krutrim-2, um modelo de linguagem de 12 bilhões de parâmetros que mostrou um forte desempenho no processamento de idiomas indianos. Nos testes de análise de sentimentos que Krutrim compartilhou terça -feiraele obteve 0,95 em comparação com 0,70 para modelos concorrentes, ao mesmo tempo em que atingiu uma taxa de sucesso de 80% nas tarefas de geração de código.

O laboratório possui vários modelos especializados, incluindo sistemas para processamento de imagens, tradução de fala e pesquisa de texto, todos otimizados para idiomas indianos.

“Ainda não estamos nem perto dos benchmarks globais, mas fizemos um bom progresso em um ano”, escreveu Aggarwal, cujos outros empreendimentos foram apoiados pelo Softbank, no X. “Ao fornecer nossos modelos, esperamos que toda a comunidade indiana colabora para criar um ecossistema de IA indiano de classe mundial. ”

A iniciativa ocorre quando a Índia procura se estabelecer em uma paisagem de inteligência artificial dominada por empresas americanas e chinesas. O recente lançamento do modelo de “raciocínio” da Deepseek, construído com um orçamento supostamente modesto, enviou ondas de choque pela indústria de tecnologia.

A Índia elogiou na semana passada o progresso da Deepseek e disse que o país sediará o LLMS do LAB chinês em servidores domésticos. O braço da nuvem de Krutrim começou a oferecer vencimento profundo em servidores indianos semana passada.

Krutrim também desenvolveu sua própria estrutura de avaliação, Bharatbenchpara avaliar a proficiência dos modelos de IA em idiomas indianos, abordando uma lacuna nos benchmarks existentes que se concentram principalmente em inglês e chinês.

A abordagem técnica do laboratório inclui o uso de uma janela de contexto de 128.000 toques, permitindo que seus sistemas lidem com textos mais longos e conversas mais complexas. As métricas de desempenho publicadas pela startup mostraram Krutrim-2 alcançando altas pontuações na correção gramatical (0,98) e conversas de várias turnos (0,91).

O investimento segue o lançamento de Krutrim-1 em janeiro, um sistema de 7 bilhões de parâmetros que serviu como o primeiro modelo de idioma da Índia. A implantação do Supercomputer com a NVIDIA está programada para ir ao ar em março, com a expansão planejada ao longo do ano.

.

Mostrar mais

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo