Ciência e Tecnologia

Muito caro: primeiras reações no RTX 4090, RTX 4080, DLSS 3 e mais da Nvidia

O quadro geral: A Nvidia finalmente tirou as capas de suas placas gráficas da série GeForce 40 de próxima geração, que parece que já faz muito tempo, considerando todos os vazamentos e rumores no último ano ou assim. Passamos algum tempo analisando a apresentação da Nvidia para dar nossa opinião sobre as novas GPUs das séries RTX 4090 e RTX 4080 e detalhar algumas das confusas revelações de desempenho da Nvidia que ofuscam as informações mais importantes.

No topo temos a GeForce RTX 4090, que é baseada na nova arquitetura Ada Lovelace construída em uma versão customizada do nó N4 da TSMC. Esta GPU é um monstro em termos de hardware, com 16384 núcleos CUDA e 24 GB de memória GDDR6X em um barramento de 384 bits, além de aumentar a velocidade do clock para a GPU de até 2,52 GHz. Como esperado, é uma placa faminta de energia com um TGP avaliado de 450W. Ele estará disponível em 12 de outubro por US$ 1.600.

Então temos a GeForce RTX 4080 16GB, que inclui 9728 núcleos CUDA, uma redução substancial da RTX 4090. aumente os clocks de até 2,51 GHz, além de 16 GB de memória GDDR6X em um barramento de 256 bits e um TGP de 320 W. O preço está definido em $ 1.200, para estar disponível um pouco mais tarde, sem data especificada.)

Há também a GeForce RTX 4080 12GB, que reduz a quantidade de memória para 12GB GDDR6X, mas também a largura de banda da memória de uma diminuição para uma interface de memória de 192 bits. Este modelo de 12 GB possui menos núcleos CUDA em 7680, com clock de até 2,61 GHz. Um TGP de 285W e um preço de US$ 900.

Além dos novos modelos de placas, a Nvidia anunciou vários recursos relacionados à nova arquitetura Ada Lovelace, que daremos nossos pensamentos mais tarde, incluindo o DLSS 3, mas por enquanto vamos falar sobre algumas das principais reações apenas sobre as próprias GPUs. temos duas GPUs GeForce RTX 4080 com especificações muito diferentes. Esta parece ser uma escolha ruim e confusa, considerando a infinidade de opções de nomenclatura que a Nvidia tem à sua disposição com números e sufixos como Ti. Não há razão para dar a essas GPUs um nome semelhante, a menos que a Nvidia tenha a intenção de enganar os clientes de alguma forma.

A maneira como a Nvidia discutiu a série RTX 4080 está destacando as diferenças na memória, 16 GB vs 12 GB, fazendo parecer que essa é a principal diferença pela qual você está pagando. À primeira vista, isso faria o RTX 4080 de 12 GB parecer um valor muito melhor, custa US $ 300 a menos e oferece o mesmo desempenho, certo? Bem, não é até você olhar para a folha de especificações que você descobre que esse não é o caso, com o modelo de 12 GB com 21% menos unidades de sombreamento e largura de banda de memória reduzida. Estas não são a mesma GPU com os próprios dados da Nvidia, sugerindo que o modelo de 16 GB pode ser mais de 25% mais rápido. Esta seria a maior diferença de desempenho entre duas placas assim denominadas na memória. Portanto, você pode apostar que os consumidores não entusiastas do dia a dia que não sabem muito sobre GPUs acabarão comprando o pior cartão de 12 GB esperando a experiência completa do RTX 4080 – algo que poderia ter sido evitado com uma nomenclatura apropriada.

Uma teoria que circula pela comunidade em geral é que o RTX 4080 12GB é realmente o que costumava ser / deveria ter sido o RTX 4070, renomeado para 4080 para suavizar o golpe do alto preço pedido ( $ 900 vs $ 500 para o RTX 3070).

Este é plausível, considerando quantas pessoas são apanhadas comparando séries versus séries ao longo das gerações e ter um salto de preço tão grande para a série x070 causaria muita decepção. Essa teoria é reforçada pelo fato de que o RTX 4080 12GB parece oferecer desempenho semelhante ao RTX 3090, e a Nvidia geralmente oferece desempenho de primeira linha da geração anterior na placa de 70 camadas da próxima geração.

No entanto, para ser honesto, o que mais importa é a relação preço/desempenho. Se o RTX 4070 fosse massivamente mais rápido que o RTX 3070 e também custasse muito mais dinheiro, ainda seria razoável se o ganho de desempenho superasse o aumento de preço. Precisaria haver algumas reorganizações e opções adicionais de nível de entrada, e os consumidores precisariam se acostumar com o novo sistema de nomenclatura, mas, em última análise, nesse tipo de cenário, o nome realmente não importaria – é o hardware e o preço que importam , em relação à concorrência e modelos anteriores.

Mas quando você tem duas placas que aparecerão nas listagens de produtos como quase a mesma GPU, ambas com nomenclatura RTX 4080, eu não Não acho razoável ter uma discrepância de desempenho significativa.

Agora vamos falar sobre o suposto desempenho dessas GPUs. A Nvidia tende a fornecer os números de desempenho mais ofuscados dos três grandes fornecedores de hardware e a menor quantidade de testes de desempenho ao falar sobre novos produtos. Os testes são frequentemente realizados comparando novas cartas com combinações estranhas da geração anterior, ou com recursos exclusivos nas novas cartas habilitadas (que são encontradas apenas em um número muito limitado de jogos) para melhorar ainda mais a aparente diferença de desempenho. Esse é definitivamente o caso desses gráficos de desempenho que têm coisas como DLSS 3 ativado… mais sobre isso mais tarde.

Ao olhar para os três jogos “padrão” que a Nvidia forneceu, o RTX 4090 parece ser cerca de 60 a 70 por cento mais rápido que o RTX 3090 Ti. Isso pode ser aumentado em até 2x ou mais quando recursos adicionais do Ada são suportados no jogo, mas eu esperaria que o ganho de desempenho na maioria dos títulos fosse semelhante a esses três jogos. Isso é um pouco menor do que o hardware sugeriria, já que o RTX 4090 tem 52% mais núcleos shader e uma frequência de boost até 34% maior, porém o TGP de 450W pode limitar isso até certo ponto, pois é o mesmo que o 3090 Ti.

Este é um impressionante aumento de desempenho geração a geração para o modelo principal, um dos maiores ganhos de desempenho que já vimos. Por exemplo, com a atualização de Turing para Ampere, o modelo principal nos deu cerca de 50% mais desempenho. Se alguns títulos acabarem entregando o dobro do desempenho, isso seria muito impressionante.

Quanto ao valor, há duas maneiras de olhar para ele… O RTX 4090 tem um valor muito melhor do que o preço de lançamento do RTX 3090 Ti de US$ 2.000, é mais barato e muito mais rápido. Ele também se compara favoravelmente ao MSRP do RTX 3090, oferecendo um enorme aumento de desempenho por apenas US $ 100 a mais. No entanto, o MSRP não é mais relevante no mercado atual. Seguindo os preços atuais (descontados em antecipação a este lançamento e ao crash da criptomoeda), o RTX 3090 Ti está disponível por US$ 1.030, enquanto o RTX 3090 mais acessível custa US$ 960. Isso daria ao RTX 4090 um preço semelhante ao desempenho do RTX 3090, considerando seu grande aumento de preço, o que não é tão ruim, já que você normalmente paga um prêmio pelo desempenho de primeira linha.

Para a GeForce RTX 4080 16GB, parece que estamos obtendo aproximadamente 25% mais desempenho do que a RTX 3090 Ti em jogos padrão – novamente um bom negócio em relação ao MSRP da série 30. O 4080 16GB é mais barato que o 3090 e similar em preço ao RTX 3080 Ti. A Nvidia alega desempenho 2-4x mais rápido que o 3080 Ti, mas isso parece ser baseado em casos especiais e não no desempenho geral.

Com base no mercado atual, isso ter preço semelhante ao desempenho em relação ao RTX 3090 e até mesmo ao RTX 3080 Ti, que atualmente está disponível por US$ 800. Não houve um grande progresso lá, e caberia aos recursos fazê-lo ultrapassar a linha.

Situação semelhante com o RTX 4080 12GB. A Nvidia está apresentando desempenho um pouco abaixo do RTX 3090 Ti, ou similar ao RTX 3090, por US$ 900. Esta placa basicamente se encaixa no preço existente para a estrutura de desempenho da linha de 30 séries da Nvidia, o RTX 3080 10GB custa cerca de US $ 740 atualmente, ainda acima de seu preço sugerido de US $ 700 e é apenas um pouco mais lento que o RTX 3090, este novo RTX 4080 12GB poderia na verdade, acabam oferecendo menos desempenho por dólar do que a série 3080 da Ampere fora dos títulos aprimorados de Ada Lovelace. não muito surpreendente. Afinal, a Nvidia aprendeu que as pessoas pagarão quantias exorbitantes de dinheiro no topo, além disso, ainda estamos na fase de recuperação de um boom de preços e há pressões inflacionárias em todo o mundo. Mas é difícil fazer uma chamada definitiva sem ver os benchmarks, e estou apenas seguindo o que a Nvidia mostrou em sua apresentação.

Os problemas com nomes e preços ofuscaram alguns dos avanços técnicos que a Nvidia está fazendo nesta geração, pelo menos por enquanto. Em particular, o DLSS 3 parece uma tecnologia muito interessante e legal, levando o DLSS um passo adiante para fornecer geração de quadros aprimorada por IA, semelhante às tecnologias de interpolação de quadros que vimos em TVs e outros hardwares há algum tempo, mas construídas especificamente para jogos e hardware GPU. A ideia é que o DLSS 3 use dados de quadros atuais e futuros para gerar porções significativas de quadros (até 7/8 dos pixels exibidos de acordo com a Nvidia). Este processo usa o fluxo óptico e o acelerador de fluxo óptico presente no hardware da GPU Nvidia.

Enquanto DLSS 3 chega em outubro e estará disponível em mais de 35 jogos em algum momento, será exclusivo do hardware da série RTX 40. O raciocínio é que requer o acelerador de fluxo óptico aprimorado na arquitetura Ada Lovelace. Embora este acelerador esteja disponível em gerações anteriores, aparentemente não é bom ou rápido o suficiente para esta tecnologia, por isso está restrito à nova geração de cartões. Com algum tipo de sobrecarga de desempenho para rodar, também não está claro quanta aceleração é possível acima de uma certa taxa de quadros, já que muitos dos exemplos que a Nvidia mostrou estavam rodando jogos em uma taxa de quadros baixa. A Nvidia mostrou demonstrações da tecnologia, mas será necessária uma análise completa da qualidade visual para ver como ela aparece na vida real. Eu definitivamente acho que é possível usar a interpolação de IA dessa maneira para jogos, mas com tantos pixels sendo reconstruídos, isso pode ter implicações na qualidade visual – como o que vemos usando o modo DLSS Ultra Performance, que geralmente parece ruim em movimento. Felizmente, o DLSS 2 é muito bom, então com mais pesquisas e aprimoramentos, certamente estou ansioso para ver como isso ficará em ação.

Outra vantagem importante do Ada Lovelace são os aprimoramentos dos núcleos de rastreamento de raios. Este é um grande negócio à medida que avançamos mais para a era do ray tracing e os requisitos de desempenho aumentam substancialmente. Os núcleos de rastreamento de raios de terceira geração da Nvidia são mais poderosos e suportam novos recursos de aceleração de hardware, como mecanismos de micro-malha e mecanismos de micromapa de opacidade. Em particular, a Nvidia afirma que esses núcleos RT podem construir BVHs de rastreamento de raios 10x mais rápido usando 20x menos VRAM através do uso de micro-malhas deslocadas, enquanto também há o dobro da taxa de interseção de triângulo de raio

Tudo pronto, a Nvidia está reivindicando 191 RT-TFLOPS de desempenho no RTX 4090, em comparação com 78 para o RTX 3090 Ti, que é uma melhoria de 2,4x (a Nvidia também reivindica até 2,8x que pode se referir a outro emparelhamento de GPU). De qualquer forma, isso superaria a melhoria de desempenho de rasterização bruta: se o RTX 4090 for aproximadamente uma melhoria de 1,7x no RTX 3090 Ti, mas o desempenho de rastreamento de raios aumentar 2,4x, isso reduziria o impacto no desempenho do rastreamento de raios em jogos ou permitiria mais efeitos de traçado de raios a serem usados. É crucial que placas de próxima geração como essa tenham desempenho de rastreamento de raio ultrapasse a rasterização para que o custo do uso de rastreamento de raio seja reduzido.

Ada também inclui núcleos tensores de 4ª geração , embora fora do DLSS não haja muitos casos de uso específicos para jogos para esses aceleradores de hardware. Há um novo mecanismo de ponto flutuante de 8 bits que oferece mais desempenho, mas isso será útil principalmente para usuários de estações de trabalho. motor NVENC de geração. A decodificação AV1 foi suportada na arquitetura anterior da Nvidia, mas a codificação AV1 não era possível até agora. Está claro agora que o AV1 será o principal sucessor do H.264 na reprodução e streaming de vídeo, portanto, ter recursos como a codificação AV1 é decisiva para o futuro. O OBS suportará a codificação AV1 em uma atualização de outubro e o Discord também a integrará ainda este ano.

Em seguida, temos a reordenação da execução do sombreador, que é um aprimoramento de arquitetura específico da Ada que reorganiza cargas de trabalho de sombreador ineficientes em um fluxo eficiente que melhora o desempenho em até a 25% em jogos. Esse recurso junto com o DLSS 3 é o motivo pelo qual a Nvidia mostrou alguns títulos oferecendo grandes melhorias de desempenho nas GPUs da série RTX 40 em relação ao Ampere, enquanto outros títulos não se beneficiarão tanto. Pudemos ver uma grande variedade de números de desempenho quando comparamos essas placas.

Quanto aos modelos Founders Edition, a RTX 4090 e a RTX 4080 16GB parecem estar recebendo placas FE , com um design semelhante à série RTX 30. Essas GPUs usam conectores PCIe 5.0 de 16 pinos para alimentação, encontrados em fontes de alimentação ATX 3.0. No entanto, a Nvidia incluirá um adaptador na caixa para uso com fontes de alimentação existentes que possuem conectores de 8 pinos.

Curiosamente, essas placas não apresentam melhorias na exibição conectividade de saída ou o barramento PCIe. Parece que o PCIe 4.0 ainda está sendo usado, enquanto estamos recebendo HDMI 2.1 e DisplayPort 1.4 – sem atualização para DisplayPort 2.0. Nem o PCIe 5.0 nem o DP 2.0 serão muito importantes nesta geração, embora seja possível que outros fornecedores de GPU usem esses recursos antes da Nvidia.

No geral, tenho sentimentos mistos sobre o lançamento do RTX 40 da Nvidia. O hardware em si parece impressionante com um aumento substancial de desempenho, um dos maiores que vimos comparando modelos emblemáticos. Há também alguns recursos interessantes que serão interessantes de explorar, como DLSS 3 e melhorias no desempenho do ray tracing além do que esperamos para jogos rasterizados padrão.

No entanto, os preços para essas novas GPUs é preocupante e não parece haver um avanço significativo na relação preço/desempenho quando comparado ao mercado atual. Ainda há muitas GPUs mais antigas a serem vendidas da série RTX 30, além de muitas GPUs usadas que chegarão ao mercado em breve. Isso pode pressionar ainda mais o preço da série RTX 40 desde o início. preços inflacionados mais. Espera-se que esses modelos se esgotem quase instantaneamente, mas o período crucial geralmente é cerca de um mês após o lançamento, quando esperamos que a Nvidia tenha placas disponíveis no MSRP – caso contrário, nosso medidor de BS será totalmente ativado.

Por enquanto, eu recomendo fortemente esperar e ver como a AMD responde com seus produtos RDNA 3, que serão revelados em 3 de novembro e esperamos que sejam lançados antes do final do ano. Esperamos uma forte concorrência e com um intervalo tão curto entre os lançamentos da Nvidia e da AMD, pode valer a pena esperar para ver onde os dois fabricantes de GPU estão nesta geração.

Mostrar mais

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo