technology

Os núcleos SiFive mais recentes aumentam o desempenho e visam aplicativos de IA/ML • Strong The One

.

SiFive lançou hoje um par de núcleos de CPU RISC-V voltados para aplicativos de alto desempenho e AI/ML.

A empresa sediada no Vale do Silício cria e licencia uma variedade de núcleos de CPU RISC-V, bem como outras propriedades intelectuais de chips para os clientes colocarem em seus próprios processadores, e também projeta seu próprio sistema em chips que pode ser encontrado em seus conselhos de desenvolvimento.

O primeiro desses novos núcleos é o Performance P870, um núcleo de processador superescalar fora de ordem de 64 bits que implementa o open RISC-V conjunto de instruções. Ele é capaz de executar Linux, Android e outros sistemas operacionais compatíveis e vem com um IOMMU e suporte de hardware para hipervisores, além de outros bits, incluindo o WorldGuard da SiFive, que realiza isolamento de código e dados em sistemas em chips.

De acordo com a SiFive, seus núcleos de desempenho são destinados a aplicações que exigem rendimento máximo e, ao mesmo tempo, minimizam o consumo de energia, como mercados móveis, de borda, de datacenter e automotivos. Diz-se que o P870 é bom para aplicativos de consumo, o que talvez seja a maneira de SiFive dizer: Por favor, coloque isso em um telefone Android.

Comparado ao seu antecessor, o P670, SiFive afirma que o novo núcleo oferece uma melhoria de 50% no desempenho. Isso, afirma o designer do chip, se traduz em uma pontuação de 18 por MHz no benchmark SpecINT2K6. E embora o designer do chip não tenha dito o quão alto o núcleo pode atingir, Brad Burgess, membro da SiFive, sugeriu que poderíamos esperar frequências “bem na faixa de 3 GHz”, durante uma apresentação provocando o design na Hot Chips neste verão.

Grande parte da melhoria de desempenho do núcleo parece vir de seu despacho fora de ordem de seis larguras, que permite ao chip distribuir instruções de forma mais eficiente em comparação com o antigo arranjo de quatro larguras no P670. Em termos de extensões vetoriais, não parece ter mudado muita coisa, com ambos ostentando unidades duplas de 128 bits.

Como aprendemos na Hot Chips, a SiFive também oferecerá uma versão automotiva do chip com alto grau de redundância e tolerância a falhas incorporada aos núcleos e à arquitetura de sistemas no chip (SoC).

O design P870 do SiFive pode suportar configurações SoC de até 32 núcleos usando oito clusters de quatro núcleos.

O design P870 do SiFive pode suportar configurações SoC de até 32 núcleos usando oito clusters de quatro núcleos… Clique para ampliar. Fonte: SiFive

Assim como os núcleos SiFive Performance anteriores, o P870 foi projetado para ser implantado em clusters que compartilham um pool de cache L2. Isso permite que o design suporte SoCs com até 32 núcleos – o dobro de seu antecessor. Durante uma apresentação provocando o núcleo na Hot Chips deste ano, a empresa detalhou como seria esse sistema em chip, com oito clusters de quatro núcleos, conectados pela interconexão multi-cluster do SiFive.

No entanto, esses clusters não precisam ser homogêneos, o que significa que o P870 pode ser emparelhado com um cluster de núcleos mais lentos e focados na eficiência, como o design P470, anunciado no outono passado, ou a família Intelligence de núcleos otimizados para vetores do fabricante de chips.

Por exemplo, o Computador de Voo Espacial de Alto Desempenho (HPSC) da NASA características oito núcleos Intelligence X280, além de quatro núcleos de CPU RISC-V de uso geral.

Então você gosta de vetores grandes?

O segundo design principal anunciado quarta-feira é o sucessor do núcleo X280 do SiFive, previsivelmente chamado de X380.

Embora núcleos como o P870 suportem instruções vetoriais em hardware, a série Intelligence da SiFive foi projetada especificamente para acelerar instruções de vetores grandes comumente usadas em casos de uso de IA e aprendizado de máquina.

Por exemplo, o X280 mencionado anteriormente suporta registros vetoriais de 512 bits. Você pode pensar nesses núcleos da mesma forma que as instruções AVX-512 da Intel ou AMD, mas em vez de incorporá-los no núcleo de uso geral, o SiFive os implementou como independentes.

O recém-anunciado X380 afirma quadruplicar o desempenho vetorial de seu antecessor. Isto foi conseguido duplicando o comprimento do vetor. O núcleo oferece suporte para registros de vetor longo de 1024 bits (VLEN) com caminhos de dados longos (DLEN) de 512 bits.

SiFive não divulgou os tipos de dados suportados antes do lançamento de hoje. No entanto, sabemos que o design do X280 suportado INT8, INT16, INT32, FP16, FP32 e FP64, além dos tipos de dados de ponto fixo Q8.8 a Q15, tornando-os amplamente aplicáveis ​​a uma variedade de cargas de trabalho de IA e ML. Perguntamos ao SiFive se o novo design adiciona suporte para quaisquer outros tipos de dados.

O núcleo pode ser fornecido com unidades lógicas aritméticas vetoriais simples ou duplas e vem equipado com a extensão de interface de coprocessador vetorial (VCIX) da SiFive, que fornece um caminho para os clientes implementarem suas próprias instruções vetoriais ou hardware de aceleração. Então, se um cliente quiser fazer algo mais especializado com os núcleos, ele pode.

Problemas no horizonte?

O lançamento dos designs principais mais recentes do SiFive ocorre menos de uma semana depois que um grupo bipartidário de legisladores dos EUA chamado para a administração Biden estender os controles de exportação de semicondutores para a China para incluir o ISA aberto RISC-V.

As ligações levaram a CEO da RISC-V International, Calista Redmond, a escrever um memorando alertando os políticos de que tal ação provavelmente resultaria no desenvolvimento de soluções incompatíveis e sufocaria a inovação.

Nos últimos anos, vimos vários chips baseados em RISC-V anunciados por empresas chinesas. No Inverno passado, a República Popular da China alegadamente tocado Alibaba e Tencent projetarão chips RISC-V para ajudar a se proteger das sanções dos EUA.

No entanto, as restrições à exportação de propriedade intelectual de semicondutores não são novas. Em um documento regulatório pré-IPO, Arm divulgado que seus núcleos Neoverse mais poderosos foram proibidos de serem vendidos na China sem licenças especiais. ®

.

Mostrar mais

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo