technology

Saciar a sede da IA ​​significa construir DCs mais inteligentes e ecológicos • Strong The One

.

Modelos generativos como GPT-4, Midjourney e outros têm compreensivelmente preocupados com o potencial da tecnologia para perturbar a sociedade, mas é saciar a sede aparentemente insaciável da IA ​​que atraiu a atenção dos pesquisadores da University of California Riverside e da University of Texas Arlington.

Em um documento divulgado [PDF] ao público no mês passado, os pesquisadores estimaram que o treinamento de um modelo de linguagem grande em escala GPT-3 usaria cerca de 700.000 litros de água, o equivalente à produção de 320 Tesla EVs.

“O ChatGPT precisa ‘beber’ uma garrafa de 500ml de água para uma conversa simples de cerca de 20 a 50 perguntas e respostas, dependendo de quando e onde o ChatGPT for implantado”, escreveram os pesquisadores.

E isso com os modelos e tecnologias atuais. Os pesquisadores antecipam que, à medida que a IA se torna mais prevalente, o consumo de água disparará, a menos que sejam tomadas medidas para lidar com as pegadas hídricas do datacenter.

Isso é uma má notícia, especialmente nos EUA. Modelos climáticos desenvolvidos no Argonne National Labs do Departamento de Energia projeto que em meados do século – daqui a apenas 27 anos – grandes porções do país estarão em estado de seca persistente.

Dissecando o consumo de água da IA

Como você pode esperar, determinar o consumo de água de algo tão complexo quanto um datacenter de IA não é exatamente um processo simples. Para começar, os pesquisadores precisam saber a eficácia do uso da água e do uso de energia (WUE/PUE) da instalação em questão, de onde obtém sua energia, como resfria suas instalações, condições climáticas, hora do dia, quantidade de energia necessária para treinar o modelo e uma série de outras métricas. O problema: esse não é exatamente o tipo de informação que os provedores de nuvem e hiperescala gostam de revelar.

“Essas empresas, por algum motivo, divulgam informações muito aproximadas sobre o uso de água – seja a eficácia média do uso da água ou o consumo total real de água, mas não ambos, e esses números geralmente são anualizados”, Shaolei Ren, professor associado de elétrica e engenharia da computação na UC Riverside e o principal investigador do jornal disse Strong The One.

Como resultado, os pesquisadores foram forçados a fazer um bom número de suposições sobre a natureza das instalações usadas para treinar esses modelos.

Apesar dessas suposições, Ren afirma que sua equipe foi capaz de adaptar um modelo desenvolvido pela SPX Cooling Technologies para estimar a quantidade de água usada por diferentes instalações em momentos diferentes, levando em consideração também as condições climáticas, usando os melhores dados disponíveis. E a partir disso, os pesquisadores dizem que foram capazes de estimar os requisitos de água para vários modelos de IA, incluindo LaMDA do Google e GPT-3 da Open AI com o que os pesquisadores acreditam ser um grau razoável de precisão.

A IA precisa ter tanta sede?

O artigo mostra uma imagem dura sobre a sede da IA ​​por água fresca, no entanto, Lucas Beran, analista do Grupo Dell’Oro, enfatiza que não são os modelos que usam a água, são os sistemas de gerenciamento térmico usados ​​para mantê-los resfriados. “Este não é um problema de IA; é um problema de gerenciamento térmico”, disse ele.

Dependendo de como e onde o datacenter é construído e se os servidores são resfriados a ar ou líquido, a quantidade de água usada pode variar muito.

No artigo, os pesquisadores se concentraram nas torres de resfriamento – uma forma de refrigerador evaporativo – porque são “a solução de resfriamento mais comum para datacenters do tipo armazém”. À medida que a água evapora, ela retira o calor do ar. Esse fenômeno torna o resfriamento evaporativo popular entre os operadores de datacenter, pois tende a usar menos energia do que a tecnologia alternativa e, em muitos climas, eles só precisam ser executados durante os meses mais quentes do ano.

Isso não quer dizer que o resfriamento evaporativo seja a única opção. No mês passado, a Microsoft empenhado ao uso da infraestrutura de resfriamento “zero água” em dois datacenters planejados no campus de Goodyear, perto de Phoenix, Arizona. No entanto, como relatamos, embora essas instalações possam usar menos água no local, elas podem acabar usando mais energia da rede como resultado.

Outra opção para reduzir o consumo de água no local é adotar uma tecnologia de resfriamento mais eficiente no nível do sistema. Hoje, muitos nós de GPU usados ​​no treinamento de IA podem extrair mais de 10kW da parede, ultrapassando os limites de um sistema refrigerado a ar.

“Investir em IA naturalmente leva você a tecnologias de gerenciamento térmico de próxima geração – em grande parte referenciando resfriamento líquido direto e resfriamento por imersão – para obter o máximo desempenho de seu hardware, bem como fazê-lo da maneira mais econômica”, disse Beran .

Embora possa parecer contra-intuitivo, a tecnologia de resfriamento líquido e de imersão pode realmente reduzir a quantidade de água usada pelos datacenters, removendo o calor com mais eficiência, explicou ele.

Para referência, Submer e LiquidStack, dois resfriamento por imersão fornecedores, muitas vezes divulgam classificações de PUE inferiores a 1,05 – tornando-os muito mais eficientes do que os datacenters refrigerados a ar típicos, que geralmente chegam a 1,4-1,5.

Quando e onde importa

Além de arquitetar datacenters de forma a minimizar o consumo de água, o documento oferece algumas recomendações para reduzir o consumo de água de IA.

A primeira é bastante simples: não treine modelos de IA em climas quentes. Segundo os pesquisadores, o treinamento de GPT-3 em datacenters asiáticos precisaria de três vezes mais água do que nos EUA. Em vez disso, os pesquisadores sugerem agendar cargas de trabalho de treinamento de IA em instalações em climas mais frios, especialmente aquelas que podem aproveitar o resfriamento gratuito. Ou, para cargas de trabalho menores, os pesquisadores sugerem agendar essas tarefas para serem executadas durante a noite, quando as temperaturas tendem a ser mais baixas e menos água é perdida por evaporação.

Os pesquisadores apontam os esforços da Apple e da Microsoft para usar o agendamento para reduzir a pegada de carbono do carregamento e atualizações de dispositivos como apenas um exemplo.

O último ponto é um pouco paradoxal, já que os horários do dia mais eficientes para o consumo de água também tendem a ser piores em termos de emissões de carbono – você não pode usar energia solar se o sol não estiver brilhando. Para contornar isso, Ren e sua equipe sugerem aproveitar os sistemas de backup de bateria do datacenter para efetivamente mudar o tempo de energia renovável de fontes como a solar até a noite.

Isso também pressupõe que o datacenter tenha um backup de bateria. Muitos datacenters existentes dependem de diesel ou gás natural célula de combustível geradores.

A falta de transparência está atrasando a pesquisa

Para entender melhor o impacto da IA ​​no consumo de água do datacenter, é necessária mais transparência, observam os pesquisadores.

“É crucial ter melhor visibilidade do WUE em tempo de execução e aumentar a transparência, mantendo informados os desenvolvedores do modelo de IA e os usuários finais”, escreveram eles.

A esse respeito, Ren e sua equipe podem estar com sorte. Como nós relatado no mês passado, a Comissão Européia está revisando as revisões da Diretiva de Eficiência Energética, que, entre outras coisas, instituiria requisitos de relatórios para todos, exceto os menores datacenters.

Enquanto Beran permanece cauteloso sobre o potencial de regulamentação para inibir os operadores de datacenter, ele concorda que uma maior transparência é essencial para otimizar essas instalações, e um requisito de relatório pelo menos nivelaria o campo de atuação.

“A indústria de data centers é tão secreta que às vezes é difícil obter os dados apropriados para construir modelos como este”, disse ele. “Gostaria de ver os grandes hiperescaladores de nuvem e colocation liderando o caminho sem precisar ser regulamentados. Mas sinto que eles estão começando a ficar sem tempo para fazer isso sozinhos antes que a regulamentação aconteça.” ®

.

Mostrar mais

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo