.
ISC O grande plano da Intel de unir CPU, GPU e memória morre em um único pacote chamado XPU está morto na água.
Em uma coletiva de imprensa antes da Conferência Internacional de Supercomputação (ISC) desta semana, Jeff McVeigh, vice-presidente do Supercomputing Group da Intel, revelou que a plataforma Falcon Shores da empresa não apenas chegaria atrasada, mas também não seria uma XPU completa.
“Meu esforço anterior para integrar uma CPU e GPU em um XPU foi prematuro”, disse ele, argumentando que o mercado mudou tanto no ano desde que detalhou o Falcon Shores que não fazia mais sentido prosseguir.
Em uma analogia um tanto artificial, McVeigh comparou a situação ao alpinismo. “A coisa sobre escalar montanhas é que você quer ir para o cume quando a janela certa estiver disponível. Se o tempo está ficando ruim, você não está se sentindo bem, você não força o cume só porque ele está lá. Você empurra quando você estiver pronto, quando o ecossistema estiver pronto, quando o clima estiver pronto.”
De acordo com McVeigh, as cargas de trabalho atuais de IA e HPC são muito dinâmicas para que a integração faça sentido. “Quando as cargas de trabalho são fixas, quando você tem uma clareza muito boa de que elas não vão mudar drasticamente, a integração é ótima”, acrescentou.
No entanto, você deve se lembrar que a flexibilidade do Falcon Shores arquitetura chiplet modular deveria ser uma vantagem, pois a Intel planejava oferecê-lo em vários SKUs com mais ou menos recursos de CPU ou GPU, dependendo do caso de uso. Esse foi o objetivo de mudar para uma arquitetura chiplet e usar a embalagem para unir tudo.
Com isso dito, a revelação não deve ser um choque. Intel eviscerado seu Accelerated Computing Group em março e, no final daquele mês, o chefe da divisão Raja Koduri saltou para uma startup de IA. A reestruturação resultou no cancelamento da Rialto Bridge, a planejada sucessora das GPUs Ponte Vecchio que alimentam o supercomputador Aurora do Argonne National Lab. No entanto, ao que tudo indica, parecia que os XPUs Falcon Shores da Intel, embora atrasados até 2025, foram poupados do desbaste. Agora sabemos que o Falcon Shores, como existe hoje, parece muito pouco com a visão apresentada pela Intel no ano passado. Em vez de configurações de CPU, GPU e CPU+GPU, estamos obtendo apenas uma GPU.
McVeigh disse Strong The One que, embora o Falcon Shores não seja um XPU, isso não significa que a Intel não reviverá o projeto quando for a hora certa.
AMD MI300 sem contestação
A decisão da Intel de não seguir sua arquitetura combinada de CPU-GPU deixa o MI300 da AMD, que segue um padrão semelhante e deve estrear no próximo mês, em grande parte incontestado – mais sobre isso depois.
A AMD vem provocando o MI300 há meses. Em janeiro, a empresa apresentou sua melhor visão da unidade de processamento acelerado (APU) – o termo preferido da AMD para arquiteturas CPU-GPU.
Com base nas fotos do pacote compartilhadas pela AMD em janeiro, o chip contará com 24 núcleos Zen 4 – o mesmo usado na plataforma Epyc 4 Genoa da AMD em novembro – distribuídos em dois chiplets que são mesclados com seis matrizes de GPU e oito memórias de alta largura de banda. módulos bons para um total de 128 GB.
Na frente de desempenho, a AMD afirma que o chip oferece 8x o “desempenho AI” sobre o MI250X usado no supercomputador Frontier, ao mesmo tempo em que atinge um desempenho 5x maior por watt. De acordo com nosso site irmão A Próxima Plataformaisso colocaria o desempenho do chip no mesmo nível de quatro GPUs MI250X, ao levar em conta o suporte para matemática de ponto flutuante de 8 bits (FP8) com esparsidade e provavelmente colocaria o chip em torno de 900 W.
Se for verdade, o MI300A está se tornando um chip picante que quase certamente exigirá resfriamento líquido para domar. Isso não deve ser um problema para os sistemas HPC, a maioria dos quais já usa resfriamento líquido direto, mas pode forçar os datacenters legados a atualizar suas instalações ou correr o risco de ficar para trás.
Não esqueça Grace Hopper
Tecnicamente falando, a AMD não é a única que busca uma arquitetura combinada CPU-GPU para o datacenter. A AMD terá alguma concorrência do superchip Grace Hopper da Nvidia, anunciado em março do ano passado.
No entanto, MI300 e Grace Hopper são bestas muito diferentes. A abordagem da Nvidia para esse problema específico foi emparelhar sua CPU Grace compatível com Arm de 72 núcleos com uma matriz GH100 usando sua interconexão proprietária NVLink-C2C de 900 GBps. Embora isso elimine o PCIe como um gargalo entre os dois componentes, eles são distintos, cada um com sua própria memória. A matriz GH100 possui sua própria memória HBM3, enquanto a GPU Grace é acoplada a 512 GB de LPDDR5, bom para 500 GBps de largura de banda de memória.
O MI300A, por outro lado, parece ser uma APU honesta e capaz de endereçar a mesma memória HBM3 sem a necessidade de copiá-la para frente e para trás em uma interconexão.
Qual abordagem renderá melhor desempenho e em quais cargas de trabalho ainda não foi respondida, mas é uma luta para a qual a Intel não terá lugar à mesa. ®
.