.
A AMD está falando de avanços internos de engenharia enquanto espera a introdução de seu primeiro chip híbrido de datacenter CPU-GPU e mais produtos Epyc, assim como a rival Intel confirma atrasos em sua própria linha de GPUs.
Falando no Morgan Stanley Na conferência de Tecnologia, Mídia e Telecomunicações, o CTO da AMD, Mark Papermaster, destacou o progresso que a empresa está fazendo com o acelerador Instinct MI250 e seu sucessor, o MI300.
Papermaster disse que a AMD iniciou o desenvolvimento das GPUs Instinct quando a empresa viu “para onde a IA estava indo”, e isso poderia ser acelerado por processamento paralelo e vetorial.
“Focamos primeiro em HPC porque já tínhamos uma pilha de software muito boa para construir. É chamada de pilha ROCm. E então ROCm 4.0 foi lançado há alguns anos, que era o nível de produção para HPC. E ter esse tipo de líder- hardware de ponta e uma pilha de HPC de produção levaram a vitórias importantes em todo o setor de HPC”, afirmou.
O ROCm 5.0 adicionou suporte para PyTorch, TensorFlow e outras estruturas de aprendizado de máquina e agora está no nível de produção para processamento de IA, disse ele.
“Se você for ao PyTorch, verá apenas duas pilhas de software classificadas em nível de produção no Linux, e isso é AMD e nosso concorrente de GPU Nvidia”, afirmou Papermaster.
O MI250 está disponível há cerca de um ano e a AMD falou sobre o chip de próxima geração, o MI300desde junho passado, então o que está acontecendo com isso?
“Anunciaremos o segundo semestre deste ano e aumentaremos em 2024”, afirmou Papermaster, descrevendo o chip híbrido CPU-GPU da empresa como “uma besta”. Isso ocorre porque “são necessárias quatro CPUs GPU – quatro CPUs Genoa – e as incorpora ao nosso processamento gráfico”, explicou ele.
Isso significa núcleos de CPU baseados no Arquitetura Epyc de 4ª geração combinado com uma GPU baseada na arquitetura CDNA 3 de última geração, conforme detalhado anteriormente.
Papermaster comparou isso com a unidade de processamento acelerado anterior da AMD (APU) para dispositivos clientes, que combinavam CPUs e funções de GPU de consumo adquiridas com a aquisição da ATI.
“Assim como enviamos CPU e GPU combinadas por anos nos mercados de PC e embarcados, agora trouxemos essa abordagem para o datacenter com o Instinct 300”, disse ele, acrescentando que a AMD tem como alvo principal os hyperscalers, em vez de tentar atingir todos os mercado vertical único com seus produtos aceleradores.
O MI300 enfrentaria um novo produto de GPU da rival Intel, o Rialto Bridge, que deveria começar a amostrar para fornecedores em meados deste ano. No entanto, isso agora foi enlatado, como A Intel revelou na semana passadae Falcon Shores, o próprio chip CPU-GPU da Intel com núcleos de CPU x86 e núcleos de GPU Xe, agora está atrasado até 2025.
A Papermaster também mencionou brevemente Siena, outro próximo membro da família de processadores de servidor Epyc de 4ª geração da AMD que terá como alvo casos de uso de computação de ponta e telecomunicações.
O Siena será “uma versão otimizada para telecomunicações do nosso Epyc de quarta geração que será lançado no segundo semestre deste ano”, disse ele, e falou sobre a sinergia que viu entre isso e o portfólio de telecomunicações que a AMD ganhou com a compra de Xilinxque a empresa apresentou no recente evento Mobile World Congress em Barcelona.
“Com o advento do 5G, a AMD agora tem um plano de controle de ponta a ponta com a presença que já tínhamos com nossa linha de produtos Epyc”, disse Papermaster.
Espera-se que o Siena tenha até 64 núcleos Zen 4 e será otimizado para desempenho por watt, mas, caso contrário, não está claro quais recursos ele terá para torná-lo mais adequado para aplicativos de telecomunicações. A família Xeon D da Intel possui funções integradas de rede e qualidade de serviço (QoS), por exemplo.
A Papermaster também foi questionada sobre a Inspur, a OEM com sede na China que foi adicionado recentemente à lista de entidades de fornecedores restritos pelo Departamento de Comércio dos EUA. A Inspur fornece servidores para muitos provedores de nuvem e clientes de HPC e tem links com muitas das grandes empresas de tecnologia dos EUA.
“Como todos em nosso setor, é claro que seguimos todas as diretrizes de controle de exportação do governo dos EUA, incluindo a Lista de Entidades”, disse ele. “Estamos buscando esclarecimentos como eu acho que o resto da indústria está, porque a Inspur é uma grande holding. Ela atende a muitos mercados. Portanto, estamos buscando obter esclarecimentos sobre essas diretrizes.”
Papermaster também falou sobre a Lei de Moore, como já fez em eventos anteriorese disse que as empresas de processadores tiveram que se adaptar à desaceleração das melhorias na densidade do transistor.
“A tecnologia de processo é fundamental em nossa indústria de semicondutores”, disse ele, “mas a Lei de Moore está diminuindo. O custo dos transistores está subindo por nó. O tipo de dimensionamento obtido, o tipo de circuito que obtém o benefício de cada novo nó de tecnologia está ficando menor. Alguns dos tipos de circuito não são escaláveis.”
Isso significa que um design de chip e a tecnologia de processo realmente precisam ser desenvolvidos juntos mais do que nunca, de acordo com Papermaster, e foi isso que levou a AMD a uma abordagem modular, como a arquitetura Infinity, que permite o particionamento de diferentes circuitos tipos para diferentes nós de processo.
“Dito isso, os novos nós permanecem de vital importância”, explicou. “Esses transistores querem operar com a maior eficiência possível. E é isso que cada novo nó de tecnologia traz. Os transistores e os novos nós estão ficando mais caros, mas ainda oferecem ganhos de eficiência, mais desempenho com menos watts de energia gasto”. ®
.