.
Com as cargas de trabalho de IA e HPC se tornando a norma, podemos esperar um impulso mais amplo em direção a tecnologias de energia e resfriamento de ponta dentro das instalações colo.
Empresas como a Colovore apontam para datacenters de colocation refrigerados a líquido de última geração, como um novo planejado para Santa Clara, Califórnia, que oferecerá suporte a sistemas ainda mais poderosos com densidades de rack de até 250kW quando estiver online em 2024.
A nova instalação, localizada ao lado de sua localização existente em Santa Clara, será o datacenter mais recente da empresa, projetado especificamente para computação de alto desempenho (HPC) e cargas de trabalho de IA/ML que consomem muita energia e desafiam termicamente.
“Quando abrimos nossas portas em 2013, divulgando 20kW por gabinete em nossa primeira fase, muitos pensaram que a densidade de potência não era um grande problema na época”, disse o presidente da Colovore, Sean Holzknecht, em um comunicado. declaração. “Agora oferecemos suporte a milhares de sistemas de IA e GPU para empresas da Fortune 500 até startups do Vale do Silício em centenas de gabinetes, cada um consumindo de 15 a 50 kW por cabine.”
Um dos desafios associados aos sistemas de IA e HPC hoje é o consumo de energia. Em média, as instalações de colocation podem oferecer entre 7 e 10 kW de capacidade por rack. Isso é bastante poder para saciar 42Us de servidores de armazenamento, computação e virtualização, mas nem de longe o suficiente para sistemas modernos de IA.
O DGX A100, por exemplo, reúne dois processadores AMD Eypc 2 de 64 núcleos de 225 W, oito GPUs A100 SXM de 400 W, nove NICs de 200 Gbit/s e um terabyte de memória do sistema em um único sistema de 5 U que pode consumir 6,5 kW de energia em plena carga. Próximos sistemas 8U DGX H100 da Nvidia, com lançamento início do ano que vemleve isso a um extremo ainda maior em 10,2 kWs.
Assumindo uma altura de rack padrão, o orçamento de rack de 50kW da Colovore poderia suportar quatro sistemas de 10kW e ainda ter espaço suficiente para a rede. E para clientes que usam refrigeração líquida direta, a empresa diz que pode suportar orçamentos de energia de rack de até 250kWs. Isso funcionaria para pouco menos de 6kW por unidade de rack.
“Nossos datacenters de alta densidade permitem que os clientes embalem seus racks de cima a baixo devido à robusta infraestrutura de energia e refrigeração que oferecemos. Isso reduz a quantidade total de espaço necessário, resultando em custos operacionais mensais e capex muito mais baixos, ao mesmo tempo em que aumenta significativamente a eficiência operacional e a escalabilidade de TI”, disse o cofundador da Colovore, Ben Coughlin.
Para atingir essas densidades, a Colovore está usando uma combinação de resfriamento líquido direto ao chip (DLC) – uma tecnologia que está se tornando cada vez mais comum entre OEMs de servidores para empacotar componentes mais quentes em chassis menores – e trocadores de calor na porta traseira.
Os sistemas DLC são bastante diretos, trocando grandes e pesados dissipadores de calor de cobre e ventiladores de alta pressão por placas frias e tubos de baixo perfil para transportar refrigerante para cada um dos componentes. Isso permite que os sistemas sejam construídos com muito mais densidade do que os sistemas tradicionais refrigerados a ar, enquanto a remoção dos ventiladores pode reduzir o consumo de energia em 13 a 20%.
O calor desses sistemas é transportado para os trocadores de calor da porta traseira, que são compostos por vários ventiladores grandes e um radiador – não muito diferente do que você encontra em um carro – que se conecta à parte traseira do rack do servidor.
A Colovore afirma que sua abordagem permite operar com eficiência de uso de energia (PUE) de 1,1, uma métrica que descreve quanto da energia usada por um datacenter realmente vai para computação, armazenamento ou equipamentos de rede. Quanto mais próximo o PUE de 1,0, mais eficiente é a instalação.
A empresa colo espera começar a alugar espaço nas instalações a partir do primeiro trimestre de 2024, bem a tempo de uma nova geração de chips de alta potência atingir a produção em volume. ®
.








