.

A estrutura nPOLO. Crédito: Fotônica da Natureza (2024). DOI: 10.1038/s41566-024-01494-z
Pesquisadores da EPFL publicaram uma estrutura programável que supera um gargalo computacional fundamental de sistemas de inteligência artificial baseados em óptica. Em uma série de experimentos de classificação de imagens, eles usaram luz dispersa de um laser de baixa potência para executar cálculos precisos e escaláveis usando uma fração da energia da eletrônica.
À medida que os sistemas de inteligência artificial digital crescem em tamanho e impacto, também cresce a energia necessária para treiná-los e implantá-los — sem mencionar as emissões de carbono associadas. Pesquisas recentes sugerem que, se a produção atual de servidores de IA continuar no ritmo atual, seu consumo anual de energia poderá ultrapassar o de um pequeno país até 2027.
Redes neurais profundas, inspiradas na arquitetura do cérebro humano, consomem muita energia devido aos milhões ou até bilhões de conexões entre várias camadas de processadores semelhantes a neurônios.
Para neutralizar essa crescente demanda de energia, os pesquisadores dobraram os esforços para implementar sistemas de computação óptica, que existem experimentalmente desde a década de 1980. Esses sistemas dependem de fótons para processar dados e, embora a luz possa teoricamente ser usada para executar cálculos muito mais rápido e eficientemente do que elétrons, um desafio fundamental tem dificultado a capacidade dos sistemas ópticos de superar o estado da arte eletrônico.
“Nosso método é até 1.000 vezes mais eficiente em termos de energia do que as redes digitais profundas de última geração, o que o torna uma plataforma promissora para a criação de redes neurais ópticas”, diz Demetri Psaltis.
“Para classificar dados em uma rede neural, cada nó, ou ‘neurônio’, deve tomar uma ‘decisão’ de disparar ou não com base em dados de entrada ponderados. Essa decisão leva ao que é conhecido como uma transformação não linear dos dados, o que significa que a saída não é diretamente proporcional à entrada”, diz Christophe Moser, chefe do Laboratório de Dispositivos Fotônicos Aplicados na Escola de Engenharia da EPFL.
Moser explica que, embora as redes neurais digitais possam facilmente realizar transformações não lineares com transistores, em sistemas ópticos, essa etapa requer lasers muito potentes.
Moser trabalhou com os alunos Mustafa Yildirim, Niyazi Ulas Dinc e Ilker Oguz, bem como com o chefe do Laboratório de Óptica, Demetri Psaltis, para desenvolver um método energeticamente eficiente para realizar esses cálculos não lineares opticamente.
A nova abordagem envolve codificar dados, como os pixels de uma imagem, na modulação espacial de um feixe de laser de baixa potência. O feixe reflete de volta sobre si mesmo várias vezes, levando a uma multiplicação não linear dos pixels.
“Nossos experimentos de classificação de imagens em três conjuntos de dados diferentes mostraram que nosso método é escalável e até 1.000 vezes mais eficiente em termos de energia do que as redes digitais profundas de última geração, tornando-o uma plataforma promissora para a realização de redes neurais ópticas”, diz Psaltis.
A pesquisa foi publicada recentemente em Fotônica da Natureza.

O núcleo do processador óptico. Crédito: Alain Herzog/École Polytechnique Federale de Lausanne
Uma solução estrutural simples
Na natureza, os fótons não interagem diretamente uns com os outros da maneira que os elétrons carregados o fazem. Para atingir transformações não lineares em sistemas ópticos, os cientistas tiveram, portanto, que “forçar” os fótons a interagir indiretamente, por exemplo, usando uma luz intensa o suficiente para modificar as propriedades ópticas do vidro ou outro material pelo qual ela passa.
Os cientistas contornaram essa necessidade de um laser de alta potência com uma solução elegantemente simples: eles codificaram os pixels de uma imagem espacialmente na superfície de um feixe de laser de baixa potência. Ao realizar essa codificação duas vezes, por meio do ajuste da trajetória do feixe no codificador, os pixels são multiplicados por si mesmos, ou seja, ao quadrado.
Como o squaring é uma transformação não linear, essa modificação estrutural atinge a não linearidade essencial para cálculos de redes neurais, a uma fração do custo de energia. Essa codificação pode ser realizada duas, três ou até dez vezes, aumentando a não linearidade da transformação e a precisão do cálculo.
“Estimamos que, usando nosso sistema, a energia necessária para calcular opticamente uma multiplicação é oito ordens de magnitude menor do que a necessária para um sistema eletrônico”, diz Psaltis.
Moser e Psaltis enfatizam que a escalabilidade de sua abordagem de baixa energia é uma grande vantagem, já que o objetivo final seria usar sistemas híbridos eletrônicos-ópticos para mitigar o consumo de energia de redes neurais digitais.
No entanto, mais pesquisas de engenharia são necessárias para atingir tal aumento de escala. Por exemplo, como os sistemas ópticos usam hardware diferente dos sistemas eletrônicos, um próximo passo no qual os pesquisadores já estão trabalhando é desenvolver um compilador para traduzir dados digitais em código que os sistemas ópticos podem usar.
Mais Informações:
Mustafa Yildirim et al, Processamento não linear com óptica linear, Fotônica da Natureza (2024). DOI: 10.1038/s41566-024-01494-z
Fornecido por École Polytechnique Federale de Lausanne
Citação: Pesquisadores desenvolvem redes neurais ópticas com eficiência energética (2024, 6 de agosto) recuperado em 6 de agosto de 2024 de https://phys.org/news/2024-08-energy-efficient-optical-neural-networks.html
Este documento está sujeito a direitos autorais. Além de qualquer uso justo para fins de estudo ou pesquisa privada, nenhuma parte pode ser reproduzida sem permissão por escrito. O conteúdo é fornecido apenas para fins informativos.
.