O Google Cloud realmente quer que as empresas continuem usando suas máquinas virtuais com tecnologia Intel. Esta semana, ela revelou um serviço “luva branca” para convencer os clientes de que vale a pena pagar mais pelo silício.
Não é nenhum segredo que as instâncias baseadas em Intel do Google Cloud são mais vantajosas do que aquelas que usam AMD Epyc ou Núcleos de CPU Altra da Ampere. Uma instância N2-Standard de oito threads e 32 GB bastante modesta baseada na plataforma Xeon Scalable da Intel, por exemplo, executará cerca de 25% mais do que uma instância baseada em Ampere Altra com o dobro dos núcleos físicos. Enquanto isso, as instâncias Epyc da AMD ficam em algum lugar no meio.
Apesar do custo mais alto das instâncias baseadas em Intel, o Google diz que, dependendo da sua carga de trabalho, optar por uma opção mais barata pode significar deixar o desempenho em a tabela e, portanto, você pode obter mais potência pelo seu dólar nas instâncias com tecnologia Intel. O Google também gastou muito dinheiro com esses Xeons e, caramba, ele quer que você use todos eles.
A Intel há muito elogia os aceleradores de IA e criptografia embutidos em seus processadores Xeon Scalable. Isso realmente se resume às suas extensões vetoriais AVX 512, Deep Learning Boost e mecanismos criptográficos. Eles podem ser usados para acelerar uma variedade de cargas de trabalho, desde transcodificação, banco de dados e inferência, sem recorrer a instâncias de GPU. Mas isso é apenas se o software do cliente for otimizado para aproveitar esses recursos.
E isso é grande o suficiente se o Google e a Intel estiverem dispostos a trabalhar individualmente com “alto crescimento corporativos” para refatorar implantações e até ajustar sua base de código de aplicativos em busca de maior desempenho.
Ampere : As compras de negócios na nuvem provam que nossas CPUs de servidor Arm são o verdadeiro negócio cargas de trabalho de inferência, Nginx, tempo de execução de linguagem e/ou transcodificação de mídia.
No programa de três fases, os engenheiros do Google e da Intel analisarão os objetivos de desempenho de um cliente e identificarão oportunidades de melhoria. Com base nessas informações, as equipes do gigante da web e do titã x86 levarão em consideração a utilização de recursos e fornecerão um relatório de desempenho detalhando as alterações recomendadas para o ambiente do cliente.
Equifax, um das primeiras corporações a participar do programa, afirmaram que as otimizações dobraram o throughput e reduziram pela metade a latência de suas implantações.
Enquanto o programa está sendo disponibilizado gratuitamente, os clientes devem solicitar o serviço. Isso sugere que a Intel e o Google podem estar bloqueando o acesso ao programa para evitar enviar clientes inadvertidamente para concorrer.
Vale a pena notar que os clientes que confiam nas instruções do AVX 512 para acelerar suas cargas de trabalho não ficar preso na Intel por muito mais tempo. Como vimos com o lançamento do Zen 4 da AMD, o rival da Intel finalmente lançará suporte para grandes extensões vetoriais para seus processadores Epyc neste outono.








