.
Análise Os fabricantes de chips chineses enfrentam uma batalha difícil para preencher o vazio deixado pela última rodada de restrições às exportações do governo Biden, anunciada esta semana.
Com a venda da maioria dos aceleradores de IA e GPUs fabricados nos EUA – incluindo aqueles desenvolvidos pela Nvidia e Intel para o mercado chinês – em breve restrito no Reino Médio, o atendimento da demanda recairá cada vez mais sobre os fornecedores nacionais, que ainda estão tentando se atualizar tecnologicamente, ou sobre o que está disponível em outros lugares para funções de HPC e IA.
Como alguns, incluindo os observadores da indústria na TrendForce, meditado, a família Ascend de chips de treinamento e inferência da Huawei poderá ter um desenvolvimento acelerado em resposta ao boicote americano. E, pelo menos em papelos cartões inicialmente parecem promissores como substitutos dos chips americanos.
Lançada em 2019, a placa de treinamento Atlas 300T e o Ascend 910 apresentam desempenho FP16 a uma curta distância do venerável A100 da Nvidia. A placa de slot duplo de altura total possui 32 GB de memória de alta largura de banda e 16 GB de memória DDR4, além de rede integrada de 100 Gb/s para expandir o sistema.
Segundo a Huawei, a versão “Pro” da placa é capaz de 280 teraFLOPS de FP16. Supondo que esses números não sejam baseados em matemática esparsa – eles não dizem – isso o coloca 32 teraFLOPS atrás do A100 da Nvidia em termos de desempenho computacional.
É importante notar que o H100 da Nvidia possui desempenho FP16 3,5x maior e velocidades de interconexão substancialmente mais rápidas para inicializar. Portanto, pelos padrões modernos, não é uma placa particularmente rápida.
No entanto, os fabricantes de chips chineses enfrentam vários obstáculos para trazer novos aceleradores de IA ao mercado. Entre os maiores seres, quem os fará?
Embora o Ascend 910 da Huawei possa parecer atraente, você deve ter percebido que, depois de quatro anos, a Huawei não anunciou um sucessor. A razão é bastante simples: o chip foi construído pela Taiwan Semiconductor Manufacturing Co. (TSMC) – uma empresa com a qual a Huawei não poderá mais fazer negócios depois dele. pousado na lista de entidades dos EUA em 2019.
Um acelerador Ascend de próxima geração teria que contar com capacidades nacionais de fabricação de semicondutores, como as oferecidas pela Semiconductor Manufacturing International Co. Mas, como informamos anteriormente, a Huawei tem trabalhado em um caseiro Plataforma de Automação de Design Eletrônico para auxiliar na produção nacional de chips, então é uma possibilidade.
Longe e Huawei não é o maior problema
Este problema não é exclusivo da Huawei.
Além de restringir a exportação dos EUA da maioria dos chips de IA modernos para o Reino Médio, os EUA também desembarcaram [PDF] 13 empresas chinesas, incluindo Biren Technology e Moore Threads, na “Lista de Entidades” do Departamento de Comércio. Biren e Moore Threads são dois dos fornecedores de GPU mais promissores da China nos últimos anos.
Nosso site irmão A próxima plataforma levou um olhar de perto na GPU local de Biren na Hot Chips no ano passado. O acelerador BR100 de 77 bilhões de transistores, construído em um processo TSMC de 7nm, reivindica 1.024 teraFLOPS de desempenho BF16 – mais de 3x o do A100 da Nvidia. No entanto, como já dissemos anteriormente relatadoa fabricante de chips foi forçada a reduzir a largura de banda de interconexão no ano passado para cumprir uma série de restrições às exportações dos EUA.
Moore Threads se concentrou mais no mercado de GPU de consumo, mas elogiado o uso de suas placas MTT S3000 para cargas de trabalho de aprendizagem profunda. Embora os detalhes sejam um pouco escassos sobre o desempenho da placa, a empresa afirma que seu kit é capaz de cerca de 15,2 teraFLOPS de desempenho FP32.
Mas, assim como o acelerador Ascend da Huawei, tanto a Biren quanto a Moore Threads dependem de fábricas estrangeiras, como a TSMC, para construir seus chips para eles. Com ambas as empresas na Lista de Entidades, é improvável que a TSMC e outras continuem a atender qualquer uma delas.
No futuro, o desenvolvimento de novos aceleradores pela Biren, Moore Threads ou Huawei provavelmente exigirá a refatoração de seus projetos para produção usando tecnologia de processo mais antiga disponível em fábricas nacionais como a SMIC.
Pelo que entendemos, a SMIC só recentemente ganhou a capacidade de produzir chips em massa baseados em um nó de processo de 14 nm. A fabricante de chips demonstrou recentemente, com o lançamento do Mate 60 Pro da Huawei, a capacidade de produzir chips em um processo de 7 nm.
Dito isto, se o operador da fundição pode realmente fazê-lo em volume é uma questão debate. Além do mais, o acesso chinês ao equipamento DUV que se acredita ter sido utilizado na produção do chip será severamente limitado quando as sanções entrarem em vigor no próximo ano.
Mesmo que o SMIC consiga acompanhar a demanda, produzir chips de IA em qualquer nó de processo é substancialmente mais difícil do que um SoC móvel. Os chips de IA tendem a ser muito maiores – o H100 da Nvidia, por exemplo, está ultrapassando os limites disso – e isso significa menos matrizes por wafer. Dependendo das taxas de defeito de 7 nm do SMIC, um único wafer pode produzir apenas um punhado de peças utilizáveis – se houver alguma.
Portanto, mesmo que a Huawei ou a Biren consigam adaptar os seus designs para produção no processo de 7nm da SMIC, há uma boa probabilidade de as taxas de rendimento serem terríveis.
Embora não haja dúvidas de que a capacidade de produção chinesa de semicondutores melhorará nos próximos anos, a capacidade do fabricante nacional de chips de preencher o vazio deixado pelas restrições comerciais dos EUA no curto prazo será limitada, especialmente quando o estoque existente estiver esgotado. ®
.