Estudos/Pesquisa

Primeiro ECRAM integrado de silício para um acelerador prático de IA — Strong The One

.

As mudanças transformadoras trazidas pelo aprendizado profundo e pela inteligência artificial são acompanhadas por custos imensos. Por exemplo, o algoritmo ChatGPT da OpenAI custa pelo menos US$ 100.000 por dia para operar. Isso pode ser reduzido com aceleradores ou hardware de computador projetado para executar com eficiência as operações específicas de aprendizado profundo. No entanto, tal dispositivo só é viável se puder ser integrado ao hardware de computação baseado em silício convencional no nível material.

Isso estava impedindo a implementação de um acelerador de aprendizado profundo altamente promissor – matrizes de memória eletroquímica de acesso aleatório, ou ECRAM – até que uma equipe de pesquisa da Universidade de Illinois Urbana-Champaign alcançou a primeira integração em nível de material de ECRAMs em transistores de silício . Os pesquisadores, liderados pelo aluno de pós-graduação Jinsong Cui e pelo professor Qing Cao, do Departamento de Ciência e Engenharia de Materiais, relataram recentemente um dispositivo ECRAM projetado e fabricado com materiais que podem ser depositados diretamente no silício durante a fabricação em Natureza Eletrônicarealizando o primeiro acelerador prático de deep learning baseado em ECRAM.

“Outros dispositivos ECRAM foram feitos com muitas propriedades difíceis de obter necessárias para aceleradores de aprendizado profundo, mas o nosso é o primeiro a alcançar todas essas propriedades e ser integrado ao silício sem problemas de compatibilidade”, disse Cao. “Esta foi a última grande barreira para o uso generalizado da tecnologia.”

ECRAM é uma célula de memória, ou um dispositivo que armazena dados e os utiliza para cálculos no mesmo local físico. Essa arquitetura de computação fora do padrão elimina o custo de energia do transporte de dados entre a memória e o processador, permitindo que operações intensivas em dados sejam executadas com muita eficiência.

A ECRAM codifica informações ao embaralhar os íons móveis entre uma porta e um canal. Pulsos elétricos aplicados a um terminal de portão injetam ou retiram íons de um canal, e a alteração resultante na condutividade elétrica do canal armazena informações. Em seguida, é lido medindo a corrente elétrica que flui através do canal. Um eletrólito entre o portão e o canal evita o fluxo indesejado de íons, permitindo que o ECRAM retenha os dados como uma memória não volátil.

A equipe de pesquisa selecionou materiais compatíveis com as técnicas de microfabricação de silício: óxido de tungstênio para o portão e canal, óxido de zircônio para o eletrólito e prótons como íons móveis. Isso permitiu que os dispositivos fossem integrados e controlados por microeletrônica padrão. Outros dispositivos ECRAM se inspiram em processos neurológicos ou mesmo na tecnologia de baterias recarregáveis ​​e usam substâncias orgânicas ou íons de lítio, ambos incompatíveis com a microfabricação de silício.

Além disso, o dispositivo do grupo Cao possui vários outros recursos que o tornam ideal para aceleradores de aprendizado profundo. “Embora a integração de silício seja crítica, uma célula de memória ideal deve alcançar uma série de propriedades”, disse Cao. “Os materiais que selecionamos dão origem a muitas outras características desejáveis.”

Como o mesmo material foi usado para os terminais de portão e canal, a injeção de íons e a extração de íons do canal são operações simétricas, simplificando o esquema de controle e aumentando significativamente a confiabilidade. O canal reteve íons de forma confiável por horas, o que é suficiente para treinar as redes neurais mais profundas. Como os íons eram prótons, o menor íon, os dispositivos mudavam rapidamente. Os pesquisadores descobriram que seus dispositivos duravam mais de 100 milhões de ciclos de leitura e gravação e eram muito mais eficientes do que a tecnologia de memória padrão. Finalmente, como os materiais são compatíveis com as técnicas de microfabricação, os dispositivos podem ser reduzidos às micro e nanoescalas, permitindo alta densidade e poder de computação.

Os pesquisadores demonstraram seu dispositivo fabricando matrizes de ECRAMs em microchips de silício para realizar a multiplicação matriz-vetor, uma operação matemática crucial para o aprendizado profundo. As entradas da matriz, ou pesos da rede neural, foram armazenadas nos ECRAMs, e a matriz executou a multiplicação nas entradas do vetor, representadas como tensões aplicadas, usando os pesos armazenados para alterar as correntes resultantes. Esta operação, assim como a atualização dos pesos, foi realizada com alto nível de paralelismo.

“Nossos dispositivos ECRAM serão mais úteis para aplicativos de computação de borda de IA sensíveis ao tamanho do chip e ao consumo de energia”, disse Cao. “É aí que esse tipo de dispositivo tem os benefícios mais significativos em comparação com o que é possível com aceleradores baseados em silício”.

Os pesquisadores estão patenteando o novo dispositivo e trabalhando com parceiros da indústria de semicondutores para levar essa nova tecnologia ao mercado. Segundo Cao, uma das principais aplicações dessa tecnologia é em veículos autônomos, que precisam aprender rapidamente sobre o ambiente ao seu redor e tomar decisões com recursos computacionais limitados. Ele está colaborando com o corpo docente de engenharia elétrica e de computação de Illinois para integrar seus ECRAMs com chips de silício fabricados em fundição e com o corpo docente de ciência da computação de Illinois para desenvolver software e algoritmos aproveitando os recursos exclusivos do ECRAM.

.

Mostrar mais

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo