.
A Graphcore, designer britânica de chips de IA, envolveu sua Unidade de Processamento de Inteligência de segunda geração, com dois anos de idade, em uma nova embalagem para a China e Cingapura em meio a problemas financeiros relatados recentemente.
A startup com sede em Bristol, no Reino Unido anunciado na terça-feira É isso aí CPU Colossus Mk2 GC200 estará disponível na nova placa C600 PCIe, tornando o processador compatível com servidores além do sistema M2000 IPU pré-integrado da empresa.
A empresa disse que as pré-encomendas já estão abertas para o cartão C600 na China e em Cingapura, e estará disponível por meio de parceiros de hardware aprovados em sistemas qualificados pela Graphcore. Não informou se o cartão irá se expandir para outros mercados.
A placa C600 foi projetada “em resposta à demanda dos clientes em mercados onde as configurações de datacenter, incluindo tamanho de rack e fornecimento de energia, variam amplamente”, disse Chen Jin, vice-presidente da Graphcore e engenheiro chefe da China, em um post de blog.
“Esse fator de forma altamente versátil permite que os clientes da Graphcore adaptem a configuração do sistema, incluindo servidor host/chassi, de acordo com seus requisitos exatos”, acrescentou Jin.
Não está claro se a Graphcore teve que ajustar a placa C600 para cumprir o recentes restrições de exportação dos EUA para chips avançados para a China. Embora a Graphcore seja uma empresa britânica, as proibições de exportação se estenderam a empresas de semicondutores muito além das fronteiras americanas porque as restrições cobrem ferramentas de fabricação e design dos EUA usadas para fabricar a maioria dos chips avançados do mundo.
As restrições dos EUA levaram os rivais muito maiores da Graphcore a mudar de marcha, com AMD interrompendo vendas de sua GPU MI250 para a China e Nvidia desacelerando sua GPU A100 para continuar as vendas no país. A Biren Technology e a Alibaba na China também tiveram que diminuir as velocidades de processamento para novas GPUs.
As especificações técnicas sugerem que é bom o suficiente
A placa C600 da Graphcore foi projetada para cargas de trabalho de inferência de IA em formatos numéricos de baixa precisão, capaz de atingir até 280 teraflops de computação de ponto flutuante de 16 bits (FP16) e fornecer até 560 teraflops de matemática de ponto flutuante de 8 bits (FP8) .
O suporte FP8 é novo para Graphcore, assim como para o resto da indústria. Intel, Arm e Nvidia publicaram a especificação para FP8 em setembro. O objetivo do FP8 é criar um formato de menor precisão para treinamento e inferência de redes neurais que otimize o uso da memória e melhore a eficiência, ao mesmo tempo em que fornece um nível de precisão semelhante às precisões de 16 bits.
A C600 é uma placa PCIe Gen 4 de dois slots com uma potência de design térmico de 185 watts. Até oito das placas podem caber em um único chassi de servidor e se comunicam diretamente usando os cabos de interconexão de alta largura de banda IPU-Link da Graphcore. A largura de banda IPU-Link do C600 é de 256 GB/s [PDF].
A IPU Mk2 dentro da placa C600 tem os mesmos 1.472 núcleos IPU e 900 MB de memória no processador quando a IPU de segunda geração foi anunciado pela primeira vez em 2020.
O lançamento do C600 não ocorre muito depois de vários relatórios pintarem um quadro sombrio para o Graphcore. Em setembro, a startup disse que planejamento de cortes de empregos devido a uma situação macroeconômica “extremamente desafiadora”. No mês seguinte, o The Times informou que os investidores haviam reduziu a avaliação da Graphcore em US$ 1 bilhão em face de problemas financeiros, incluindo um acordo rescindido com a Microsoft. ®
.