technology

Tesla gastando mais de $ 1 bilhão em Dojo para treinamento de IA autônomo • Strong The One

.

A Tesla diz que está gastando mais de US$ 1 bilhão em seu supercomputador Dojo até o final de 2024 para ajudar a desenvolver software de veículos autônomos.

O Dojo foi mencionado pela primeira vez pelo CEO Elon Musk durante um dia de investidor da Tesla em 2019. Ele foi construído especificamente para treinar modelos de aprendizado de máquina necessários para processamento e reconhecimento de vídeo para permitir que os veículos sejam autônomos.

Durante a teleconferência de resultados do segundo trimestre da Tesla nesta semana, Musk disse que a Tesla não seria um “circuito aberto” em seus gastos com o Dojo, mas a soma envolvida certamente seria “mais de um bilhão até o final do próximo ano”.

“Para nos copiar, você também precisaria gastar bilhões de dólares em computação de treinamento”, afirmou Musk, dizendo que desenvolver um sistema de direção autônoma confiável é “um dos problemas mais quentes de todos os tempos”.

“Você precisa dos dados e dos computadores de treinamento, as coisas necessárias para realmente alcançar isso em escala em direção a uma solução generalizada de autonomia”.

Musk apontou que o treinamento de modelos complexos de aprendizado de máquina precisa de grandes volumes de dados, quanto mais melhor, e é a isso que a Tesla tem acesso, graças a toda a telemetria de seus veículos.

“Com relação ao piloto automático e ao dojo, para construir autonomia, obviamente precisamos treinar nossa rede neural com dados de milhões de veículos. Isso foi comprovado repetidamente, quanto mais dados de treinamento você tiver, melhores serão os resultados”, disse ele.

“Mal funciona com 2 milhões [training examples]. Com 3 milhões, é como, uau, OK, estamos vendo algo. Mas então, você chega a 10 milhões de exemplos de treinamento, torna-se incrível. Portanto, não há substituto para uma enorme quantidade de dados. E, obviamente, a Tesla tem mais veículos na estrada coletando esses dados do que todas as outras empresas juntas. Acho que talvez até uma ordem de magnitude”, afirmou Musk.

No próprio sistema Dojo, Musk disse que foi projetado para reduzir significativamente o custo do treinamento da rede neural e foi “um tanto otimizado” para o tipo de treinamento exigido pela Tesla, que é o treinamento em vídeo.

“Vemos uma demanda por recursos de treinamento realmente vastos. E achamos que podemos atingir a capacidade interna de treinamento de rede neural de 100 exaFLOPS até o final do próximo ano”, afirmou Musk, que é bastante poder de computação, para dizer o mínimo.

Dojo é baseado em grande parte no Tesla’s tecnologia própria, começando com o chip D1 que compreende 354 núcleos de CPU personalizados. Vinte e cinco desses chips D1 estão interligados em uma matriz 5×5 dentro de um módulo de “bloco de treinamento”, construindo a configuração básica do Dojo V1 com 53.100 núcleos D1, de acordo com nossos colegas da A Próxima Plataforma.

Mas não parando por aí, Musk acredita que com todos os dados de treinamento à sua disposição e um “computador de inferência de alta eficiência” no carro, o sistema de direção autônoma da Tesla em breve tornará seus veículos não apenas tão proficientes quanto um motorista humano, mas eventualmente muito melhores. Quando? Ele não disse e tem forma em fazer grandes reivindicações.

“Até o momento, mais de 300 milhões de milhas foram percorridas usando o FSD [Full Self-Driving] Beta. Esse número de 300 milhões de milhas vai parecer muito pequeno, muito rapidamente. E o FSD deixará de ser tão bom quanto um humano para ser muito melhor que um humano. Vemos um caminho claro para a direção totalmente autônoma ser 10 vezes mais segura do que o motorista humano médio”, afirmou.

Isso é importante, explicou Musk, porque “no momento, acredito que haja algo em torno de um milhão de mortes automotivas por ano. E se você for 10 vezes melhor que um ser humano, isso ainda significaria 100.000 mortes.

O Dojo não é o único supercomputador que a Tesla tem para treinamento em vídeo. A empresa também construiu um cluster de computação equipado com 5.760 GPUs Nvidia A100mas Musk disse que eles simplesmente não conseguiam GPUs suficientes para a tarefa.

“Na verdade, pegaremos o hardware o mais rápido que a Nvidia nos entregar”, disse ele, acrescentando: “Se eles pudessem nos fornecer GPUs suficientes, talvez não precisássemos do Dojo, mas eles não podem porque têm muitos clientes”. ®

.

Mostrar mais

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo