technology

Intel abandona plano de XPU para combinar CPU, GPU e memória • Strong The One

.

ISC O grande plano da Intel de unir CPU, GPU e memória morre em um único pacote chamado XPU está morto na água.

Em uma coletiva de imprensa antes da Conferência Internacional de Supercomputação (ISC) desta semana, Jeff McVeigh, vice-presidente do Supercomputing Group da Intel, revelou que a plataforma Falcon Shores da empresa não apenas chegaria atrasada, mas também não seria uma XPU completa.

“Meu esforço anterior para integrar uma CPU e GPU em um XPU foi prematuro”, disse ele, argumentando que o mercado mudou tanto no ano desde que detalhou o Falcon Shores que não fazia mais sentido prosseguir.

Em uma analogia um tanto artificial, McVeigh comparou a situação ao alpinismo. “A coisa sobre escalar montanhas é que você quer ir para o cume quando a janela certa estiver disponível. Se o tempo está ficando ruim, você não está se sentindo bem, você não força o cume só porque ele está lá. Você empurra quando você estiver pronto, quando o ecossistema estiver pronto, quando o clima estiver pronto.”

De acordo com McVeigh, as cargas de trabalho atuais de IA e HPC são muito dinâmicas para que a integração faça sentido. “Quando as cargas de trabalho são fixas, quando você tem uma clareza muito boa de que elas não vão mudar drasticamente, a integração é ótima”, acrescentou.

No entanto, você deve se lembrar que a flexibilidade do Falcon Shores arquitetura chiplet modular deveria ser uma vantagem, pois a Intel planejava oferecê-lo em vários SKUs com mais ou menos recursos de CPU ou GPU, dependendo do caso de uso. Esse foi o objetivo de mudar para uma arquitetura chiplet e usar a embalagem para unir tudo.

Com isso dito, a revelação não deve ser um choque. Intel eviscerado seu Accelerated Computing Group em março e, no final daquele mês, o chefe da divisão Raja Koduri saltou para uma startup de IA. A reestruturação resultou no cancelamento da Rialto Bridge, a planejada sucessora das GPUs Ponte Vecchio que alimentam o supercomputador Aurora do Argonne National Lab. No entanto, ao que tudo indica, parecia que os XPUs Falcon Shores da Intel, embora atrasados ​​até 2025, foram poupados do desbaste. Agora sabemos que o Falcon Shores, como existe hoje, parece muito pouco com a visão apresentada pela Intel no ano passado. Em vez de configurações de CPU, GPU e CPU+GPU, estamos obtendo apenas uma GPU.

McVeigh disse Strong The One que, embora o Falcon Shores não seja um XPU, isso não significa que a Intel não reviverá o projeto quando for a hora certa.

AMD MI300 sem contestação

A decisão da Intel de não seguir sua arquitetura combinada de CPU-GPU deixa o MI300 da AMD, que segue um padrão semelhante e deve estrear no próximo mês, em grande parte incontestado – mais sobre isso depois.

A AMD vem provocando o MI300 há meses. Em janeiro, a empresa apresentou sua melhor visão da unidade de processamento acelerado (APU) – o termo preferido da AMD para arquiteturas CPU-GPU.

Com base nas fotos do pacote compartilhadas pela AMD em janeiro, o chip contará com 24 núcleos Zen 4 – o mesmo usado na plataforma Epyc 4 Genoa da AMD em novembro – distribuídos em dois chiplets que são mesclados com seis matrizes de GPU e oito memórias de alta largura de banda. módulos bons para um total de 128 GB.

Na frente de desempenho, a AMD afirma que o chip oferece 8x o “desempenho AI” sobre o MI250X usado no supercomputador Frontier, ao mesmo tempo em que atinge um desempenho 5x maior por watt. De acordo com nosso site irmão A Próxima Plataformaisso colocaria o desempenho do chip no mesmo nível de quatro GPUs MI250X, ao levar em conta o suporte para matemática de ponto flutuante de 8 bits (FP8) com esparsidade e provavelmente colocaria o chip em torno de 900 W.

Se for verdade, o MI300A está se tornando um chip picante que quase certamente exigirá resfriamento líquido para domar. Isso não deve ser um problema para os sistemas HPC, a maioria dos quais já usa resfriamento líquido direto, mas pode forçar os datacenters legados a atualizar suas instalações ou correr o risco de ficar para trás.

Não esqueça Grace Hopper

Tecnicamente falando, a AMD não é a única que busca uma arquitetura combinada CPU-GPU para o datacenter. A AMD terá alguma concorrência do superchip Grace Hopper da Nvidia, anunciado em março do ano passado.

No entanto, MI300 e Grace Hopper são bestas muito diferentes. A abordagem da Nvidia para esse problema específico foi emparelhar sua CPU Grace compatível com Arm de 72 núcleos com uma matriz GH100 usando sua interconexão proprietária NVLink-C2C de 900 GBps. Embora isso elimine o PCIe como um gargalo entre os dois componentes, eles são distintos, cada um com sua própria memória. A matriz GH100 possui sua própria memória HBM3, enquanto a GPU Grace é acoplada a 512 GB de LPDDR5, bom para 500 GBps de largura de banda de memória.

O MI300A, por outro lado, parece ser uma APU honesta e capaz de endereçar a mesma memória HBM3 sem a necessidade de copiá-la para frente e para trás em uma interconexão.

Qual abordagem renderá melhor desempenho e em quais cargas de trabalho ainda não foi respondida, mas é uma luta para a qual a Intel não terá lugar à mesa. ®

.

Mostrar mais

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo