technology

Epycs de 128 núcleos da AMD lutam contra a Ampere Computing • Strong The One

.

Análise Com o lançamento de seu Epycs de 128 núcleos, com o codinome Bergamo, a AMD apresentou um desafio para a posição provisória da Ampere Computing na arena de nuvem e hiperescala.

Apesar da ameaça iminente de outro chip nativo da nuvem, o diretor de produtos da Ampere Computing, Jeff Wittich, não está muito preocupado. “Continuo confiante de que temos uma posição de liderança neste espaço”, disse ele Strong The One.

Desde o lançar de sua família de processadores Altra em 2020, a Ampere obteve sucesso criando peças densas e com baixo consumo de energia, destinadas a cargas de trabalho de escalabilidade horizontal e nativas da nuvem. A estratégia garantiu ao fabricante de chips um lugar em quase todas as principais nuvens públicas e gerou componentes de contagem de núcleos ainda maiores, como o Altra Max de 128 núcleos e o AmpereOne de 192 núcleos.

Mas onde o Ampere antes preenchia uma lacuna no mercado de cargas de trabalho que priorizavam a densidade do núcleo acima de tudo, o novo fabricante de chips agora tem Intel, AMD e todo o impulso da arquitetura x86 para enfrentar.

Mesmo assim, Wittich diz que essa competição é um sinal de que a empresa está no caminho certo. “Esperávamos que, como fomos bem-sucedidos, outros nos seguiriam por esse caminho”, disse ele. “Somos nós que temos vários anos de experiência com um grupo bastante robusto de clientes que usam nossos processadores.”

Como as fichas se acumulam?

À primeira vista, Bérgamo da AMD parece bem posicionado para competir com o Altra Max da Ampere. Ambos os chips apresentam 128 núcleos que foram reduzidos e otimizados para uma variedade de cargas de trabalho de nuvem populares, incluindo Nginx, Memcached, Redis e FFmpeg, para citar alguns.

No entanto, é aqui que a comparação começa a desmoronar. Além da contagem de núcleos, os dois chips não poderiam ser mais diferentes. Por um lado, o Altra Max da Ampere tem mais de dois anos.

Lançado em 2021, o Altra Max de 128 núcleos da Ampere era essencialmente um versão ampliada do processador Altra de 80 núcleos lançado um ano antes. Como tal, ele usou o mesmo núcleo Arm Neoverse N1 pronto para uso, que já tinha dois anos na época, e foi fabricado usando a já madura tecnologia de processo de 7nm da TSMC.

Bergamo, em comparação, está usando os nós de 5 nm e 6 nm da TSMC em suas matrizes de computação e E/S, bem como uma versão reduzida de sua arquitetura de núcleo Zen chamada Zen 4c. O último permitiu que a AMD empacotasse 16 núcleos em oito matrizes de computação. Portanto, o Bergamo não apenas tem o benefício de uma tecnologia de processo mais eficiente, mas também apresenta um novo design de núcleo apoiado por memória e E/S mais rápidas – PCIe 5.0 e 12 pistas de DDR5 vs PCIe 4.0 e oito pistas de DDR4 no Altra .

Portanto, não deve ser uma surpresa que a AMD esteja reivindicando uma vantagem bastante substancial sobre o Altra Max da Ampere. Nos benchmarks internos da AMD, o Bergamo alegou desempenho 2,9 vezes maior em média em uma variedade de cargas de trabalho nativas da nuvem em comparação com o chip de 128 núcleos da Ampere.

Além de executar nossos próprios benchmarks em um ambiente controlado, é difícil dizer como eles realmente se comparam, então recomendamos aceitar as afirmações da AMD com cautela. Com isso dito, podemos ter uma ideia de como os dois chips se comparam núcleo a núcleo observando suas pontuações SPECrate Integer Base.

Envios de soquete único mostram que o processador de 128 núcleos e 256 threads da AMD Epyc 9754 pontua em torno de 922 no benchmark, cerca de 2,58x mais do que o Altra de alta especificação da Ampere, o M128-30que vem em 356.

Embora seja uma vitória clara para o Bergamo da AMD, ele não leva em consideração outros elementos como o consumo de energia. A parte da AMD é classificada para 360W e pode ser configurada em até 400W, enquanto a da Ampere tem um TDP de apenas 182W. Então, sim, pode ser 2,5 vezes mais rápido, mas potencialmente usa 2 a 2,2 vezes mais energia.

É por isso que a Ampere há muito tempo prefere observar o desempenho para um determinado orçamento de energia de rack. Na verdade, a Wittich afirmou que seus processadores Altra Max podem superar o Bergamo no benchmark SPECrate Integer em desempenho em nível de rack.

A ideia aqui é que, para um determinado orçamento de energia, o Ampere pode acomodar mais sistemas e, portanto, mais núcleos no rack do que a AMD, resultando em maior potência no nível do rack. No entanto, quando pedimos à Ampere para apoiar essas reivindicações, eles nos informaram que era uma estimativa baseada nas informações disponíveis. Outra pitada de sal, por favor.

A concorrência de Bergamo não é a Altra

Embora não possamos culpar a AMD por fazer comparações de desempenho com a família Altra da Ampere, já que eles são o que você pode comprar e comparar hoje, não é exatamente uma boa comparação.

Provedores de nuvem realistas e hiperescaladores não farão compras cruzadas Bergamo Epycs contra peças de dois ou três anos de Ampere. Em vez disso, a comparação mais interessante será contra a segunda geração do fabricante de chips. Linha AmpereOne.

Anunciado no final de maio, o AmpereOne continua de onde a Altra parou, oferecendo SKUs que variam de 136 a 192 núcleos Arm do próprio projeto do fabricante de chips. Embora Ampere não tenha falado muito sobre desempenho – bem, além de um punhado de itens escolhidos a dedo e benchmarks questionáveis – eles prometeram melhorias de instrução por relógio (IPC) em relação ao Altra, juntamente com melhorias na virtualização, gerenciamento de congestionamento de malha, previsão de ramificação, segurança e gerenciamento de energia.

Parte desse desempenho provavelmente se deve à nova configuração de cache do chip, que aumenta o cache L2 por núcleo para 2 MB – é o dobro do Altra ou do Bergamo.

Os próprios núcleos estão alojados em uma única matriz de computação de 5 nm, enquanto as funcionalidades de E/S e memória são divididas em vários chiplets de 7 nm. Basicamente, o oposto do que a AMD fez com o Epyc.

Apesar da mudança para um nó mais eficiente, os chips de alta especificação do Ampere agora são classificados para 350 W, colocando-o no mesmo patamar de Bergamo. Infelizmente, teremos que esperar e ver o quão bem o AmpereOne se sai contra os Epycs da AMD.

contenção de nuvem

Não importa quão bom seja o seu chip se ninguém o quiser. E quando se trata da categoria altamente específica de chips centrados na nuvem e com densidade de núcleo, a Ampere certamente conquistou o mercado nos últimos três anos.

Com a notável exceção da Amazon Web Services, quase todos os provedores de nuvem pública – incluindo Oracle, Microsoft, Google, Tencent, Alibaba e Baidu – implantaram partes Altra ou Altra Max da Ampere.

Em comparação, a AMD ficou bastante quieta sobre quais provedores de nuvem planejavam implantar o Bergamo. No entanto, entre os hiperescaladores, o fabricante de chips conquistou pelo menos uma vitória com o planejamento da Meta, controladora do Facebook, para implantar suas partes de Gênova e Bérgamo, mas resta saber em que quantidades.

Com isso dito, não é incomum que os provedores de nuvem gastem seu tempo com essas coisas. Embora a Oracle tenha sido um dos primeiros provedores de nuvem a apoiar o Ampere, não foi até o verão passado que o Google se juntou à festa.

Também não é como se a AMD já não tivesse relacionamentos profundos com provedores de nuvem e hiperescaladores. Antes de Ampere aparecer com Altra e Altra Max, a AMD era a fabricante de chips preferida se você quisesse maximizar a densidade do núcleo. Lembre-se de que em 2019, as peças com maior número de núcleos da Intel chegaram a 28 núcleos, enquanto a AMD havia acabado de lançar suas CPUs Epyc 2 de 64 núcleos.

Bergamo pode ser capaz de competir contra o AmpereOne na contagem de núcleos, mas para provedores de nuvem, o suporte x86-64 nativo pode muito bem valer um déficit de 30% em núcleos. Notaremos que a AMD também não é a única que promete peças x86 ultra-core-densas. O Sierra Forest Xeons da Intel, que será lançado no início do ano que vem se a Intel for notoriamente roteiro não confiável acredita-se, dividirá a diferença com 144 núcleos.

Embora a Arm tenha feito um progresso considerável certificando cargas de trabalho populares para uso em seus núcleos, sob sua Certificação SystemReady programa, permanece o fato de que o ISA é um recém-chegado ao espaço do datacenter.

Embora haja muitos softwares por aí que funcionam tão bem em um núcleo x86 quanto em um Arm, também há muitos softwares que não funcionam. Para referência, o hipervisor ESXi da VMware restos um projeto sem suporte, o que eles chamam de “Fling”, após cinco anos de desenvolvimento.

Por causa disso, a AMD e a Intel podem obter vitórias simplesmente devido à menor barreira à entrada e à familiaridade arquitetônica em comparação com as alternativas Arm. ®

.

Mostrar mais

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo