Ciência e Tecnologia

Os novos hardware deixaram os data centers perfeitos para as IA

A NVIDIA revelou hoje um novo hardware poderoso para servir como os principais blocos de construção de sua visão de transformar data centers em “fábricas de IA”, abrindo novas fronteiras em computação técnica.

Na palestra da conferência GTC 2022 da NVIDIA, o CEO Jensen Huang disse que os aplicativos de IA estão impulsionando mudanças fundamentais no design do data center.

“Os data centers de IA processam montanhas de dados contínuos para treinar e refinar modelos de IA”, disse Huang. “Dados brutos chegam, são refinados e a inteligência sai – as empresas estão fabricando inteligência e operando fábricas gigantes de IA.”

Para impulsionar essa transformação, a NVIDIA revelou sua nova arquitetura Hopper GPU e GPU H100, juntamente com novos sistemas que otimizarão o novo hardware para tarefas de computação massivas – como a criação de gêmeos digitais de armazéns da Amazon de milhões de pés quadrados, o que facilitará o treinamento robótico. sistemas para gerenciar essas instalações.

Huang é um visionário chave em computação de alto desempenho, que vê a computação técnica como um empreendimento que muda o mundo. Isso foi percebido em sua palestra no GTC, quando Huang compartilhou uma visão de um futuro em que a inteligência é criada em escala industrial e tecida em mundos reais e virtuais.

Isso inclui as mudanças climáticas, pois Huang compartilhou uma atualização sobre o plano da NVIDIA de criar o Earth-2 – um gêmeo digital para toda a Terra que pode ser usado para modelar soluções climáticas em escala sem precedentes.

“Os cientistas prevêem que um supercomputador um bilhão de vezes maior do que o atual é necessário para simular efetivamente as mudanças climáticas regionais”, disse Huang. “A NVIDIA vai enfrentar esse grande desafio com nosso Earth-2, o primeiro supercomputador gêmeo digital de IA do mundo, e inventar novas tecnologias de IA e computação para nos dar um bilhão de X antes que seja tarde demais.”

 

Arquitetura Hopper é bem-sucedida com GPUs Ampere

 

É uma grande visão, mas Huang e NVIDIA têm um histórico de grandes inovações em computação de alto desempenho (HPC). A tecnologia de processamento gráfico (GPU) da NVIDIA tem sido um dos principais impulsionadores da ascensão da computação especializada, permitindo novas cargas de trabalho em supercomputação, inteligência artificial (IA) e carros conectados.

A adoção das GPUs NVIDIA também aumentou a densidade de energia dos racks dentro dos data centers, o que em muitos casos exigiu resfriamento adicional para gerenciar o calor nos ambientes de TI.

A NVIDIA vem investindo pesadamente em inovação em IA, que vê como uma tendência de tecnologia generalizada que levará sua tecnologia de GPU a todas as áreas da economia e da sociedade. A plataforma de IA da empresa agora é usada por 25.000 empresas em todo o mundo.

A arquitetura Hopper da NVIDIA, batizada em homenagem à cientista da computação pioneira Grace Hopper, traz novos níveis de poder computacional. Hopper sucede a arquitetura NVIDIA Ampere, lançada há dois anos.

A primeira GPU baseada em Hopper é a H100, com mais de 80 bilhões de transistores. Ele foi criado usando a tecnologia de processo de 4 nanômetros da fundição de chips TSMC. “O Hopper H100 é o maior salto geracional de todos os tempos – desempenho de treinamento em escala 9x superior ao A100 e taxa de transferência de inferência de modelo de linguagem grande de 30x”, disse Huang.

O Hopper é otimizado para acelerar cargas de trabalho usando o Transformer, um modelo de aprendizado profundo desenvolvido pelo Google que permite aos pesquisadores trabalhar com conjuntos de dados maiores em tarefas como processamento de linguagem natural e visão computacional. O H100 inclui um Transformer Engine que, segundo a NVIDIA, pode acelerar drasticamente esses projetos sem perder a precisão.

“O modelo Transformer é agora o bloco de construção dominante para redes neurais”, disse Paresh Kharya, diretor sênior de gerenciamento de produtos e marketing para computação acelerada da NVIDIA. “A computação necessária para treinar grandes modelos de transformadores está explodindo.”

Plataformas de nuvem que planejam integrar a arquitetura Hopper em suas ofertas Amazon Web Services, Google Cloud, Microsoft Azure e Oracle Cloud, juntamente com Alibaba, Baidu e Tencent Cloud.

Os principais fabricantes de sistemas que planejam servidores com aceleradores H100, incluindo Cisco, Dell Technologies, Fujitsu, Hewlett Packard Enterprise, Inspur, Lenovo, Supermicro e uma ampla variedade de fornecedores de servidores focados em HPC.

 

Sistemas DGX mais poderosos chegando aos data centers

 

O H100 será integrado ao NVIDIA DGX de quarta geração , o “supercomputador em uma caixa” projetado para implementações em ambientes tradicionais de data center, incluindo provedores de colocation no programa DGX-Ready da NVIDIA. Cada sistema DGX contará com oito GPUs H100 por sistema, fornecendo 32 petaflops de desempenho de IA, disse a empresa.

O DGX H100 estará disponível no final de 2022 e deverá exigir até 10,2 quilowatts de potência em um sistema de 6 unidades de rack, um aumento significativo em relação aos 6,5 kW em seu antecessor, o DGX A100 . Um rack de data center típico seria capaz de suportar fisicamente até cinco unidades DGX, mas somente se seu ambiente puder lidar com até 50 kWs de densidade.

É por isso que a visão de Huang de data centers como “fábricas de IA” exigirá tecnologias avançadas de resfriamento, que podem incluir sistemas otimizados de contenção refrigerados a ar ou uma variedade de opções de resfriamento líquido.

 

Em outros anúncios do GTC:

 

A NVIDIA está desenvolvendo o Omniverse Cloud, um conjunto de serviços em nuvem que oferece aos artistas, criadores, designers e desenvolvedores acesso à plataforma NVIDIA Omniverse para design e simulação 3D. O serviço está atualmente em desenvolvimento e a NVIDIA não compartilhou uma data de lançamento ou indicou onde sua infraestrutura de nuvem residiria. A NVIDIA opera operações online por meio de data centers internos e espaço alugado em fornecedores atacadistas. Relatórios do setor indicam que a NVIDIA arrendou cerca de 14 megawatts de nova capacidade de data center em 2021.

A NVIDIA anunciou o NVIDIA Spectrum-4, a próxima geração de sua plataforma Ethernet. A plataforma de rede de ponta a ponta de 400 Gbps oferece uma taxa de transferência de comutação 4x maior do que as gerações anteriores, com 51,2 terabits por segundo, disse a empresa.

Configurações expandidas estão em desenvolvimento para a CPU NVIDIA Grace, que foi anunciada no ano passado, é baseada na microarquitetura Arm com eficiência energética encontrada em bilhões de smartphones e dispositivos de computação de ponta . No GTC 2022, a NVIDIA disse que o Grace estará disponível como um “superchip” com dois chips de CPU conectados por uma interconexão de chip a chip de baixa latência.

A empresa anunciou o NVIDIA OVX, um sistema de computação projetado para impulsionar simulações de gêmeos digitais em larga escala que serão executadas no NVIDIA Omniverse.

Com seu foco em gêmeos digitais, a NVIDIA está oferecendo uma visão diferente e específica para as tecnologias do metaverso, que têm sido um tema quente desde que o Facebook mudou para Meta no outono passado. À medida que analistas e usuários lutam com a proposta de valor de uma rede social virtual, a visão da NVIDIA para gêmeos digitais com tecnologia Omniverse vem com uma visão mais clara de como os mundos 3D podem se traduzir em ganhos concretos nos negócios e na ciência.

A NVIDIA diz que a OVX permitirá que projetistas e engenheiros construam gêmeos digitais de edifícios fisicamente precisos. As empresas podem avaliar e testar sistemas e processos complexos, com vários sistemas autônomos interagindo para otimizar fábricas e armazéns, ou treinar robôs e veículos autônomos antes de implantá-los no mundo físico.

“Os gêmeos digitais fisicamente precisos são o futuro de como projetamos e construímos”, disse Bob Pette, vice-presidente de Visualização Profissional da NVIDIA. “Os gêmeos digitais mudarão a forma como todos os setores e empresas planejam. O portfólio de sistemas da OVX será capaz de alimentar gêmeos digitais em escala industrial, em tempo real, sempre síncronos e em todos os setores.”

Em sua palestra, Huang compartilhou como a Amazon usa o Omniverse Enterprise para projetar e otimizar suas operações de atendimento.

“Os centros de atendimento modernos estão evoluindo para maravilhas técnicas – instalações operadas por humanos e robôs trabalhando juntos”, disse Huang. “A IA revolucionará todas as indústrias.”

Mostrar mais

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo