A GPU Ada Lovelace de última geração da Nvidia atinge 100 TFLOPs de poder de processamento FP32

A GPU Ada Lovelace de última geração da Nvidia atinge 100 TFLOPs de poder de processamento FP32
O mercado de GPUs está aquecendo à medida que os dois principais concorrentes, NVIDIA e AMD, se preparam para lançar suas placas gráficas de próxima geração antes do final deste ano. Com o Arc A-Series, a Intel, a principal empresa de processadores, também está entrando no mercado de gráficos discretos pela primeira vez. Desta vez, as três empresas competirão pelos bolsos das pessoas, a concorrência está em alta e os vazamentos são inevitáveis.

Vazamentos e rumores de várias fontes circularam em um momento em que não havia notícias oficiais. Novos anúncios sobre os principais SKUs da NVIDIA e AMD são lançados todos os dias, e hoje não é exceção, pois temos dois novos anúncios sobre o poder de processamento de ambos os concorrentes. Curiosamente, os números atuais da Equipe Verde e Vermelha são surpreendentemente semelhantes, dando outra indicação de quão quente o mercado estará.

Embora eu já tenha escrito um artigo sobre a GPU principal da AMD e o desempenho esperado, este artigo é sobre o próximo BFGPU da NVIDIA. Ada Lovelace, a arquitetura de GPU de última geração da NVIDIA no coração da próxima série RTX 4000 (ou seja lá como for chamada), supostamente fornece uma grande atualização sobre a série RTX 3000 de geração atual. Essa estratégia é quase idêntica à da AMD, que também traz melhorias significativas em relação ao RDNA 2 com RDNA 3.

GPU NVIDIA Ada Lovelace | NVIDIA

Ada Lovelace atinge 100 teraflops 

A GPU de próxima geração da NVIDIA é a AD102 e será usada para alimentar a RTX 4090 (e 4090 Ti) e possivelmente até uma placa da classe TITAN. De acordo com dois novos rumores de insiders populares kopite7kimi e Greymon55 , o AD102 quebrará a barreira de 100 TFLOP e oferecerá o mais alto desempenho de computação FP32 de qualquer placa de vídeo popular. 

Em comparação, a geração atual RTX 3090 Ti oferece 40-45 teraflops de poder de processamento FP32, que é o mais alto de qualquer GPU no momento. Portanto, estamos olhando para uma melhoria de pelo menos 2x em relação ao BFGPU atual com AD102. No ano passado, quando o RTX 3090 (não-Ti) ainda era a GPU de jogos de nível de consumidor de maior desempenho construída pela NVIDIA, um vazamento da própria Greymon afirmou que o AD102 teria mais que o dobro do poder do RTX 3090, um relatório que em grande parte permaneceu verdadeiro. e até hoje.

Ambos os líderes se opõem ao número exato de capacidades do AD102 FP32, mas o consenso geral é que provavelmente atingirá e excederá 100 TFLOPs. Por outro lado, há rumores de que a GPU Navi 31 da próxima geração da AMD tem poder de processamento de 92 TFLOP FP32. Isso é 4 vezes mais que o RX 6900XT com 23 teraflops. Este aumento de desempenho sem precedentes também explica o salto significativo no consumo de energia.

Hoje, GPUs de 350-400W se tornaram a norma, com o RTX 3090 Ti quebrando facilmente 500W em algumas opções extremas de GPU. Esta já é uma mudança significativa em relação à norma de 275W da geração anterior. Mas na próxima geração, esperamos que as placas gráficas tenham TGPs de até 900W. Você não precisa ser um engenheiro de hardware para saber que isso é loucura. As GPUs já estavam com fome de energia, mas a próxima geração está prestes a levar esse precedente a um nível totalmente diferente.

É importante notar que o TFLOP não é tudo o que importa no final do dia. Mais teraflops não se traduz diretamente em melhor desempenho nos jogos. Há muitos outros fatores em jogo aqui, e até mesmo os próprios líderes sugerem que coisas como recursos de rastreamento de raios, tecnologia de dimensionamento proprietária e muito mais contribuirão para o sucesso da GPU de próxima geração.

Detalhamento adicional

Em termos de especificações, a pontuação de 100 TFLOP do AD102 é alcançada acomodando 18.432 núcleos CUDA com clock de 2,7 GHz. No entanto, este é o número máximo de núcleos CUDA presentes em uma matriz de tamanho completo que o RTX 4090 Ti (e possivelmente o novo RTX TITAN) usará. O RTX 4090 provavelmente terá uma versão reduzida do AD102 que afetará os TFLOPs. Mas, como eu disse, os TFLOPs não são tão importantes, e menos núcleos significam velocidades de clock mais altas, o que na verdade tem um impacto significativo no desempenho dos jogos.

Por exemplo, Greymon55 afirmou que a próxima geração de GPU RDNA 3 da AMD funcionará em até 3GHz. Embora a frequência de 2,7 GHz do AD102 já esteja muito próxima disso, o RTX 4090 reduzido pode realmente corresponder às velocidades de clock Boost da AMD. Portanto, espere que ~3GHz seja a velocidade de clock padrão para as placas gráficas da próxima geração. E você pode agradecer ao nó de processo de 4 nm da TSMC por ser parcialmente responsável por isso, pois será usado para fabricar as GPUs RDNA 3 e Ada Lovelace.

Novamente, tudo isso é desempenho teórico, você nem precisa conhecer o poder de processamento TFLOP da sua GPU para avaliar seu desempenho nos jogos. Os teraflops são calculados multiplicando o número total de núcleos pela velocidade do clock da GPU e, em seguida, multiplicando esse resultado por 2 para obter o número de TFLOPs. Observe que este é um nível muito superficial de estimativa de quantas operações (ponto flutuante) uma GPU pode realizar por segundo, pois não leva em consideração outras características, provando que os teraflops são mais bem guardados apenas para flexibilidade.

Ainda assim, é divertido olhar para os números para analisar tudo meses antes do lançamento de um produto, quero dizer, afinal, essa é a essência do jornalismo de hardware de jogos. Mas não teremos que esperar muito até que as notícias oficiais cheguem. Espera-se que a AMD e a NVIDIA lancem suas GPUs de próxima geração na mesma época no terceiro trimestre deste ano, com anúncios antecipados começando hoje. Computex 2022 em maio.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *