technology

Intel divulga instruções x86 e vetoriais para futuros chips • Strong The One

.

A Intel revelou dois conjuntos de extensões chegando à arquitetura do conjunto de instruções x86, um para aumentar o desempenho do código de uso geral e o segundo para fornecer um conjunto de instruções de vetor comum para chips futuros.

Alguns dos detalhes foram revelados no Intel’s site do desenvolvedor, mostrando as extensões de desempenho avançado (Intel APX) ampliando o conjunto de instruções x86 com acesso a mais registros e outros recursos destinados a melhorar o desempenho de uso geral. O Advanced Vector Extensions 10 (Intel AVX10), por sua vez, é descrito como uma “arquitetura moderna de conjunto de instruções vetoriais” a ser suportada em futuros processadores Intel.

O APX representa o que a Intel está lançando como uma grande jogada para o futuro de sua arquitetura. Sua principal característica é a duplicação do número de registradores de uso geral de 16 para 32. Ter mais registradores significa que há menos necessidade de fazer malabarismos com os valores, e esta é uma maneira pela qual a Intel afirma que aumentará o desempenho.

Especificamente, permitirá que o compilador mantenha mais valores nos registradores, de modo que o código que tira proveito do APX possa exigir 10% menos carregamentos da memória e potencialmente mais de 20% menos armazenamentos do que o mesmo código compilado para o conjunto de instruções existente, afirma a Intel .

Isso significa que a CPU gasta mais tempo fazendo cálculos em vez de mover os dados, enquanto os acessos aos registradores também são mais rápidos e consomem menos energia do que operações complexas de carga e armazenamento.

Os novos registradores de uso geral são habilitados para XSAVE, o que significa que podem ser salvos e restaurados automaticamente por sequências XSAVE/XRSTOR durante as trocas de contexto, diz a Intel. Área XSAVE adicional não é necessária para isso, pois os registradores fazem uso do espaço anteriormente alocado para os registradores usados ​​com o agora obsoleto Intel MPX extensões.

O APX também adiciona formas condicionais das instruções de carregamento, armazenamento e comparação/teste, destinadas a combater o impacto no desempenho que os aplicativos podem obter de previsões incorretas de ramificação condicional. Eles são implementados por meio de extensões de prefixo EVEX de instruções legadas existentes.

De acordo com a Intel, os desenvolvedores podem aproveitar o APX recompilando o código, e não se espera que sejam necessárias alterações no código-fonte.

Perguntamos à Intel quando seus chips de processador implementariam as novas instruções APX e atualizaremos este artigo se obtivermos uma resposta.

O AVX10, de acordo com a Intel, é a primeira grande atualização do novo conjunto de instruções vetoriais desde a introdução do AVX-512. Destina-se a fornecer uma instrução de vetor convergente comum definida em todas as arquiteturas Intel e, portanto, será suportada em todos os processadores futuros, incluindo núcleos de desempenho (P-cores) e núcleos de eficiência energética (E-cores).

O AVX10 é baseado no conjunto de recursos Intel AVX-512 e suporta todos os comprimentos de vetores de instrução (128, 256 e 512), bem como instruções escalares e opmask.

No entanto, parece que a versão “convertida” do AVX10 que será comum em todos os processadores Intel terá um comprimento vetorial máximo de 256 bits e registradores opmask de 32 bits. Isso é conhecido como Intel AVX10/256.

O suporte para vetores de 512 bits e registradores opmask de 64 bits continuará a ser oferecido em alguns processadores P-core “para aplicativos de computação de vetores pesados ​​que podem aproveitar o comprimento de vetor adicional”. Isso é conhecido como Intel AVX10/512.

Embora isso possa parecer um pouco confuso, parece que a Intel deseja simplificar o suporte ao desenvolvedor para instruções vetoriais, tendo um nível de linha de base de suporte em todos os chips para código que se beneficia disso, como processamento de IA.

Para esse fim, o AVX10 também apresentará a enumeração do conjunto de instruções baseado em versão, que é uma maneira sofisticada de dizer que todos os chips Intel com um determinado número de versão do AVX10 oferecerão suporte aos mesmos recursos e instruções.

O código do desenvolvedor precisará verificar apenas três campos, de acordo com a Intel: um bit de recurso CPUID indicando que o AVX10 é suportado, o número da versão do AVX10 e um bit indicando o comprimento máximo do vetor suportado.

De acordo com a Intel, o Granite Rapids os chips de servidor com vencimento no próximo ano servirão como um ponto de transição do AVX-512 para o AVX10. Eles apresentarão o AVX10 Versão 1, que não incluirá as novas instruções vetoriais de 256 bits.

O AVX10 Versão 2 incluirá os formulários de instrução de 256 bits, além de instruções extras que abrangem novos tipos e conversões de dados de IA, otimizações de movimentação de dados e suporte a padrões ®

.

Mostrar mais

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo