technology

AMD Epyc 4 supera Intel para DDR5, PCIe 5.0 no datacenter • Strong The One

.

O status da AMD como azarão desorganizado atrás da Intel foi alterado. A fabricante de chips conseguiu sair à frente da rival Intel com o lançamento de sua quarta geração de processadores Epyc “Genoa” nesta semana.

A mais recente evolução da plataforma de servidor da AMD não apenas aumenta a contagem de núcleos para 96 ​​e velocidades de clock de até 4,4 GHz, mas também supera o Sapphire Rapids da Intel no mercado como a primeira CPU x86 no datacenter com suporte para DDR5, PCIe 5.0 e Compute Padrões Express Link (CXL).

As CPUs são baseadas na mesma microarquitetura Zen 4 e nós de processo TSMC 5nm que vimos no AMD Ryzen 7000-series desktop chips no início deste ano. Isso, de acordo com o AMD Fellow e o criador do Zen, Mike Clark, contribui para uma melhoria de 14% de instrução por relógio (IPC) em relação ao Zen 3.

No entanto, os ganhos do IPC são apenas parte da história. Combinado com contagens de núcleos e velocidades de clock mais altas, Ram Peddibhotla, vice-presidente de gerenciamento de produtos Epyc da AMD, afirma que suas principais CPUs Epyc 4 de 96 núcleos são duas vezes mais rápidas que as peças Milan de 64 núcleos do ano passado em uma variedade de computação em nuvem e de alto desempenho ( HPC) e benchmarks corporativos. Como de costume, recomendamos tomar essas alegações com um grão de sal saudável.

Mais núcleos, maior consumo de energia

Dando uma olhada no dissipador de calor agora ainda maior do Genoa – sim, há um novo soquete também – revela como a AMD conseguiu reunir tantos núcleos em um único pacote. Você adivinhou, mais chiplets.

O pacote maior abre espaço para quatro Core Complex Dies (CCDs) adicionais, elevando o total para 12. O layout real desses chiplets, no entanto, permanece praticamente inalterado em relação ao Milan, com oito núcleos compartilhando 32 MB de cache L3 entre eles. O que é novo é a mudança dos 7nm da TSMC para o processo de 5nm mais avançado e o uso dos núcleos Zen 4 da AMD, que dobra o cache L2 para 1 MB por núcleo.

A AMD também aumentou a velocidade do clock dos chips em várias centenas de megahertz, embora aparentemente à custa de térmicas mais altas. A potência de design térmico padrão (TDP) núcleo a núcleo não mudou muito em relação à geração anterior – pairando em torno de 280 W para as peças de 64 núcleos da AMD – mas agora os clientes que desejam extrair as frequências mais altas possíveis desses chips agora podem configurá-los até 400W. Isso representa um aumento de 120W no consumo de energia em comparação com Milão.

Os TDPs configuráveis ​​mais altos do Genoa não são surpreendentes, dada a tendência de toda a indústria para CPUs e GPUs mais quentes e com maior densidade de energia nos últimos anos. Ainda esta semana nós aprendido que as CPUs Sapphire Rapids de 56 núcleos da Intel – agora chamadas de “Intel Xeon CPU Max” – consumirão cerca de 350W, colocando-o apenas um fio de cabelo abaixo do Epyc 4 9654 de 96 núcleos da AMD em um TDP padrão de 360W. Enquanto isso, no espaço da GPU, fornecedores como a Nvidia já estão aumentando o consumo de energia de 700W em um único módulo SXM.

Embora a AMD diga a você que o Epyc 4 extrai mais trabalho de cada watt, isso não muda o fato de que o envelope de energia mais alto representa um desafio para os construtores de servidores encarregados de encontrar uma maneira de dissipar todos os aquele calore os operadores de datacenter que precisam alimentar esses sistemas.

Memória como você quiser

Olhando além do desempenho bruto, o Epyc 4 também oferece várias melhorias de memória e E/S em relação ao Milan. Os processadores são os primeiros chips de datacenter da AMD com suporte para memória DDR5.

A matriz de E/S da Genoa — que agora é baseada em um processo TSMC de 6 nm em oposição à tecnologia de 14 nm da GlobalFoundry — suporta 12 canais de DDR5 4.800 MT/s até 6 TB por soquete. De acordo com a AMD, isso resulta em uma largura de banda máxima teórica de memória de 460 GB/s quando todos os 12 canais são preenchidos com memória DDR5 de 4.800 MT/s.

É claro que mesmo um DIMM por canal preenchendo todos esses canais pode ser complicado, especialmente em sistemas tradicionais de soquete duplo.

O Genoa também aumenta o número de interfaces para 160 pistas de PCIe 5.0 e adiciona 64 pistas dedicadas ao CXL. Das pistas PCIe, 32 podem ser dedicadas para conectividade SATA, enquanto os sistemas de soquete duplo ganham 12 pistas “bônus” adicionais de conectividade PCIe 3.0.

Falando em CXL, o Genoa é a primeira plataforma x86 com suporte para a interface de cache coerente. Embora futuras iterações do CXL permitam uma infraestrutura completa composable, as primeiras implementações da tecnologia estão focadas diretamente na expansão de memória.

É aqui que a AMD está concentrando sua atenção para sua primeira incursão no CXL. O Genoa oferece suporte a uma versão modificada do CXL 1.1 que suporta backports para configurações de memória de camada. E a AMD claramente espera que o CXL seja um sucesso no datacenter, pois já estendeu sua tecnologia de criptografia de memória usada em computação confidencial – chamada SEV-SNP – para esses módulos de expansão de memória prontos para uso.

Embora a AMD suporte CXL, isso não significa que o ecossistema esteja necessariamente pronto para aproveitar a nova tecnologia. Enquanto alguns fornecedores como os laboratórios Samsung e Astera têm anunciado módulos de memória CXL, o padrão ainda está em sua infância.

E aqueles que esperam aproveitar as vantagens mais avançadas Aceleradores CXL terá que esperar até que a AMD envie uma CPU que suporte totalmente a especificação CXL 2.0 necessária para tecnologias como pool de memória.

Comendo o almoço da Intel

Embora a AMD possa ter uma vantagem inicial em CXL, PCIe 5.0 e DDR5 no datacenter, não demorará muito para que a Intel traga seus processadores Xeon de volta à paridade de recursos.

A Intel esperava vencer a AMD no mercado com seu processador escalável Xeon de 4ª geração, codinome Sapphire Rapids, por mais de um ano. Infelizmente, atrasos repetidos na CPU o colocaram, e o Supercomputador Aurora do Laboratório Nacional de Argonne, lamentavelmente atrasado.

A partir do último atraso no início deste mês, a Intel espera as primeiras remessas de volume do chip a chegar ao mercado no primeiro trimestre de 2023.

E, claro, a AMD não perdeu a oportunidade de capitalizar a luta da Intel para trazer o chip ao mercado. Apontando para os processadores Xeon Platinum 8380 de 40 núcleos da Intel – no momento o mais rápido disponível da fabricante de chips – a AMD afirma que o Genoa é de 2,5x a 3x mais rápido no popular ponto flutuante SPECrate 2017 e benchmarks inteiros, respectivamente.

Claro que é com mais do dobro dos núcleos por soquete. Em uma comparação núcleo a núcleo, Peddibhotla estima que o Genoa supera a geração Ice Lake da Intel em cerca de 50% no benchmark inteiro do SPECrate 2017 e 78-96% no benchmark de ponto flutuante.

E embora a Intel tenha uma vantagem sobre a AMD em cargas de trabalho que dependem do conjunto de instruções AVX-512 para coisas como aprendizado profundo e inferência de IA. Com a mudança para o Zen 4, a AMD fechou a lacuna com suporte nativo para cargas de trabalho de vetores grandes.

Como tal, teremos que esperar até que o Sapphire Rapids da Intel seja lançado no início do próximo trimestre para ter uma noção melhor de como os chips da fabricante de chips se comparam ao Genoa.

Vá mais fundo… Para uma análise completa, detalhes de configurações, conectividade e muito mais, confira nossos amigos na próxima plataforma.

No lançamento, o Genoa pode ser adquirido em 18 sabores, variando de 16 núcleos na extremidade inferior a 96 núcleos no topo da pilha.

Assim como os processadores Epyc da geração anterior, a AMD oferecerá muitas dessas peças em configurações que priorizam o desempenho por núcleo, densidade de núcleo ou uma combinação dos dois.

Os primeiros sistemas Epyc dos parceiros OEM da AMD são acessível para pedidos a partir de hoje, com os sistemas chegando às mãos dos clientes já em dezembro.

Também vale a pena notar que Gênova é apenas o primeiro de quatro CPUs de datacenter baseadas em Zen 4 com lançamento previsto para o próximo ano. As CPUs Bergamo focadas na nuvem da AMD aumentarão a contagem de núcleos novamente para 128, embora nos digam às custas de caches menores. Esses chips parecem ter como objetivo combater os 128 processadores Core Altra Max da Ampere, que tiveram ampla adoção entre provedores de nuvem pública, incluindo Microsoft Azure, Google Cloud e Oracle Cloud Infrastructure.

A AMD também tem outro Epyc empilhado em cache em andamento, codinome Genoa-X, que deve competir diretamente com os processadores Xeon Max empilhados HBM da Intel, bem como um chip focado em telecomunicações e borda chamado Siena, que vai atrás da fortaleza da Intel na borda. ®

.

Mostrar mais

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo