technology

Biden impõe proibição à exportação de chips de IA para a China • Strong The One

.

Análise Com a última rodada de restrições comerciais aos chips de IA, a administração Biden está prestes a praticamente isolar o mercado chinês de GPUs e aceleradores de última geração – não apenas no datacenter, mas também em casa.

As regras, anunciadas esta semana, procuram impedir que pessoas ou empresas dos EUA promovam as agendas militares e de vigilância da República Popular da China – e de outros países preocupantes.

E como já dissemos anteriormente relatado, as restrições atualizadas provavelmente afetarão uma grande parte da linha de GPUs da Nvidia, incluindo seus kits H800 e A800 construídos para cumprir as regras de exportação do outono passado. Isso é uma má notícia para os gigantes chineses da web que supostamente planejado para comprar cartões no valor de US$ 4 bilhões em 2024, e para empresas dos EUA, como Intel e AMD, trabalhando em seus próprios chips reduzidos para venda no Reino Médio, e uma má notícia para os fornecedores que esperam vender mais hardware.

Limites de desempenho para chips com destino à China

Até agora, o principal limite de desempenho em GPUs e aceleradores de IA exportados para países preocupantes – ou seja, a China – centrou-se na largura de banda de interconexão. Isso se refere à velocidade com que os processadores podem se comunicar entre si. Regras do ano passado restrito a exportação de chips com largura de banda de interconexão bidirecional de 600 GB/s, sem licença especial.

Em resposta, Nvidia e Intel ajustado suas mais recentes GPUs, diminuindo as velocidades de interconexão para contornar as restrições do Departamento de Comércio. Os H800 que mencionamos anteriormente são um excelente exemplo.

A administração Biden deu agora um passo adiante ao implementar um conjunto de limites para a densidade de desempenho. De acordo com o arquivamento do Bureau of Industry and Security (BIS) [PDF] esta semana, a primeira e provavelmente a mais importante destas regras restringe a exportação de:

“Os circuitos integrados com uma ou mais unidades de processamento digital apresentam uma das seguintes características: a.1. um ‘desempenho de processamento total’ de 4.800 ou mais, ou a.2. um ‘desempenho de processamento total’ de 1.600 ou mais e um ‘desempenho de processamento’ densidade’ de 5,92 ou mais.”

Calcular a pontuação de desempenho total de processamento (TPP) para qualquer GPU ou acelerador é um projeto bastante simples. Dobre o número máximo de operações tera densas – ponto flutuante ou número inteiro – um segundo e multiplique pelo comprimento do bit da operação. Se houver diversas métricas de desempenho anunciadas para diversas precisões — INT4, FP8, FP16 e FP32, por exemplo — a pontuação TPP mais alta será usada.

Usando o L40S da Nvidia como exemplo, a equação seria mais ou menos assim:

2 x 733 teraFLOPS x 8 bits = um TPP de 11.728

Os mais atentos devem ter notado que não estamos usando os 1.466 teraFLOPS do FP8 anunciados pela Nvidia em sua folha de dados. Isso porque, para fins de cálculo do TPP, os processadores que oferecem cálculos densos e esparsos deveriam desconsiderar estes últimos.

O valor do TPP pode então ser usado para determinar a densidade de desempenho do chip. Este valor é calculado dividindo o TPP pela “área aplicável da matriz”. Voltando ao nosso exemplo L40S, a GPU usa a matriz AD102, que tem uma área de superfície de 609 mm², então nosso cálculo seria mais ou menos assim:

11.728 TPP / 609 mm² = densidade de desempenho de 19,25

Isso o coloca bem acima do limite de densidade de desempenho de 5,92 imposto pelas novas regras. Porém, observaremos que não está claro se a memória é considerada lógica para fins de cálculo da densidade de desempenho.

E quanto aos chips de baixo custo?

Para chips menos potentes, há uma exceção um tanto estranha. De acordo com o arquivamento do BIS:

“b. Circuitos integrados com uma ou mais unidades de processamento digital com uma das seguintes características: b.1 um ‘desempenho de processamento total’ igual ou superior a 2.400 e inferior a 4.800 e uma ‘densidade de desempenho igual ou superior a 1,6 e inferior a 5,92.”

Isso parece ser direcionado a GPUs e aceleradores mais antigos, como o Instinct MI100 da AMD, que estimamos ter um TPP de 2.953 e uma densidade de desempenho de 3,93.

No entanto, uma placa como a GPU L4 de fator de forma pequeno da Nvidia poderia passar sem contestação, apesar de ter um TPP de cerca de 3.880. Com uma área de matriz de 294 mm², sua densidade de desempenho ficaria fora da faixa descrita na regra.

É provavelmente por isso que a placa não foi produzida pela Nvidia lista de GPUs afetadas pelas regras. Essa lista incluía A100, A800, H100, H800, L40, L40S e RTX 4090 – mais sobre esta última em um minuto. A Nvidia se recusou a comentar mais sobre as restrições à exportação e nos apontou de volta ao seu pedido anterior à SEC.

A regra também inclui disposições para chips com densidades de desempenho mais baixas que podem ser vendidos para a China e outros países. Ele define controles para chips com TPP de 1.600 ou mais e densidade de desempenho de 3,2 ou mais e inferior a 5,92. Se tivéssemos que adivinhar, esta regra tem como objetivo evitar que os fabricantes de chips usem vários chips de desempenho inferior para contornar as limitações.

Não apenas Nvidia

Embora a Nvidia – que controla uma grande fatia do mercado de chips de IA – provavelmente arcará com o peso desta decisão, a Intel e a AMD também serão quase certamente afetadas pelas regras.

Embora o MI250X com especificações mais altas da AMD – por enquanto – fosse sujeito às restrições de exportação do ano passado, o MI210 tecnicamente caiu abaixo do limite de largura de banda de 600 GB/s. No entanto, pelas nossas estimativas, essa placa tem uma pontuação TPP de 5.792 e uma densidade de potência de 8, portanto, é improvável que a AMD consiga vender a placa na China assim que as regras entrarem em vigor no final deste outono.

A AMD declarou publicamente que está trabalhando em um acelerador especial semelhante ao A800 e H800 da Nvidia à venda na China. A AMD não respondeu ao nosso pedido de comentários no momento da publicação.

Suspeitamos que a Intel também esteja em um barco semelhante com seu Gaudi2 de especificação chinesa HL225Bdado o histórico anterior da empresa reivindicações que o acelerador superou o A100 da Nvidia, pelo menos em certas cargas de trabalho selecionadas de IA. Mas, como a Intel não nos diz qual é o desempenho de ponto flutuante dos aceleradores, é difícil dizer com certeza. Num comunicado fornecido a Strong The Onea gigante dos chips disse que está “revisando os regulamentos e avaliando o impacto potencial”.

GPUs de consumo principalmente poupadas por enquanto

É importante notar que as novas regras afetam explicitamente apenas os chips projetados para aplicações de datacenter, o que significa que a maioria dos cartões de consumo não será afetada. Isso ocorre apesar do fato de muitas GPUs usarem as mesmas matrizes que suas contrapartes de datacenter.

Uma exceção descrita no arquivamento do BIS é para cartões com TPP de 4.800 ou mais.

É por isso que, no documento da Nvidia à SEC, a empresa disse que provavelmente não conseguiria mais vender seus cartões RTX 4090 na China. Pela nossa estimativa, esse kit tem uma pontuação TPP em torno de 5.285. No entanto, também é provavelmente a única placa gráfica de consumo sujeita a controles de exportação para a China – pelo menos por enquanto.

Pelos nossos cálculos, a placa gráfica de consumo mais poderosa da AMD, a RX 7900 XTX, chega com uma pontuação TPP de 3.904, abaixo do limite para placas de consumidor.

Esta é uma lacuna potencialmente problemática nas regras, pois é acreditava que as agências chinesas já usaram GPUs Nvidia e processadores Intel reaproveitados, obtidos através de empresas de fachada, para alimentar coisas como simuladores de armas nucleares. Dito isto, as novas regras incluem disposições para dificultar as importações indiretas.

O número de GPUs para consumidores e datacenters que se enquadram nessas restrições provavelmente aumentará à medida que os fornecedores lançam placas novas e mais poderosas. Por exemplo, o 7900 XTX da AMD apresentou desempenho FP32 aproximadamente 2,5x maior que seu antecessor.

Isso sugere que a próxima GPU de desktop topo de linha que vemos da AMD quase certamente ultrapassará os limites. Isso, a menos, é claro, que o governo dos EUA faça ajustes regulares na trave da baliza.

Deixe o estoque começar

De acordo com os observadores da indústria na TrendForce, as regulamentações provavelmente meio-fio O apetite chinês pelos servidores de IA de ponta da Nvidia passou de 5 a 6 por cento da demanda global para 3 a 4 por cento.

Além do mais, o grupo prevê que grandes provedores de web e nuvem, como ByteDance, Baidu, Alibaba e Tencent, começarão a armazenar GPUs antes que as novas regras entrem em vigor. “É provável que a Nvidia também tente alocar seus recursos atualmente escassos, como o H800, para uso de clientes chineses”, disse a TrendForce em nota de pesquisa.

A longo prazo, a TrendForce espera que as empresas chinesas acelerem o desenvolvimento de chips independentes e apontou o salto do Pingtouge da Alibaba para a arena ASIC e os investimentos da Huawei na sua plataforma de computação Ascend como exemplos.

Entretanto, os analistas sugerem que as empresas chinesas provavelmente transferirão o desenvolvimento da IA ​​para recursos alugados noutros locais.

Embora as restrições às exportações possam tornar mais difícil para os interesses chineses obter chips de IA dos EUA, elas não fazem muito para abordar o acesso online através da nuvem.

Os aceleradores de IA são amplamente implantados em nuvens públicas, onde podem ser acessados ​​remotamente de qualquer lugar do mundo. Isso representa um problema que a administração Biden ainda não resolveu na última rodada de restrições aos chips.

De acordo com o documento do BIS, a agência está buscando comentários públicos e “contribuições de [infrastructure-as-a-service] fornecedores sobre a viabilidade de cumprirem regulamentações adicionais nesta área, como identificariam se um cliente está “desenvolvendo” ou “produzindo” um modelo de base de IA de dupla utilização e quais ações seriam necessárias para resolver esta preocupação de segurança nacional ao mesmo tempo que minimiza as alterações nos processos de negócios que seriam necessárias para cumprir essas regulamentações.” ®

.

Mostrar mais

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo