APU AMD Instinct MI300A entra em produção em volume: até 4 vezes mais rápido que NVIDIA H100 em HPC, duas vezes mais eficiente

APU AMD Instinct MI300A entra em produção em volume: até 4 vezes mais rápido que NVIDIA H100 em HPC, duas vezes mais eficiente

Além do MI300X para IA, a AMD também anuncia que sua APU Instinct MI300A entrou em produção em volume e deverá oferecer o desempenho de HPC mais rápido do mundo quando for lançado no próximo ano.

AMD impulsiona HPC para o próximo nível com APUs Instinct MI300A, 4X mais rápidas e mais rápidas 2X mais eficiente que NVIDIA H100

Esperamos durante anos que a AMD finalmente cumprisse a promessa de uma APU da classe Exascale e o dia se aproxima à medida que nos aproximamos do lançamento do Instinct MI300A. Hoje, a AMD confirmou que a APU MI300A entrou em produção em volume neste trimestre e está a caminho de se tornar a solução HPC mais rápida do mundo quando estiver disponível em 2024.

amd-instinct-mi300a-apu-for-hpc_1amd-instinct-mi300a-apu-for-hpc_2amd-instinct-mi300a-apu-for-hpc_3

O APU AMD Instinct MI300A é uma combinação de várias arquiteturas e tecnologia de interconexão com a arquitetura Zen 4, CDNA 3 e 4ª Geração Infinity na vanguarda. Alguns dos destaques das APUs MI300A incluem:

  • Até 61 TFLOPS de computação FP64
  • Até 122 TFLOPS de computação FP32
  • Até 128 GB de memória HBM3
  • Largura de banda de memória de até 5,3 TB/s
  • 146 bilhões de transistores

A embalagem do MI300A é muito semelhante à do MI300X, exceto que utiliza capacidades de memória e recursos otimizados para TCO. Zen 4 núcleos. Então, vamos aos detalhes dessa potência em exaescala para data centers de HPC e IA de próxima geração.

AMD Instinct MI300X e Aceleradores MI300A AI detalhados: CDNA 3 & Zen 4 se reúne em uma embalagem avançada Marvel 3
Acelerador AMD Instinct MI300A.

Uma das matrizes ativas tem dois GCDs CDNA 3 cortados e substituídos por três CCDs Zen 4 que oferecem seu conjunto separado de cache e IPs principais. Você obtém 8 núcleos e 16 threads por CCD, totalizando 24 núcleos e 48 threads na matriz ativa. Há também 24 MB de cache L2 (1 MB por núcleo) e um pool separado de cache (32 MB por CCD). Deve-se lembrar que os GCDs CDNA 3 também possuem o cache L2 separado.

AMD Instinct MI300X e Aceleradores MI300A AI detalhados: CDNA 3 & Zen 4 vem junto em uma embalagem avançada Marvel 5
Acelerador AMD Instinct MI300A com CDNA 3 e amp; Zen 4 morre.

Para o lado da GPU, a AMD habilitou um total de 228 unidades de computação baseadas na arquitetura CDNA 3, o que equivale a 14.592 núcleos. São 38 unidades de computação por chiplet GPU. Resumindo alguns dos recursos destacados dos aceleradores AMD Instinct MI300, temos:

  • Primeiro pacote integrado de CPU+GPU
  • Visando o mercado de supercomputadores Exascale
  • AMD MI300A (CPU + GPU integrada)
  • 146 bilhões de transistores
  • Até 24 núcleos Zen 4
  • Arquitetura de GPU CDNA 3
  • 228 unidades de computação (14.592 núcleos)
  • Até 128 GB de memória HBM3
  • Até 8 chips + 8 pilhas de memória (processo 5nm + 6nm)
amd-instinct-mi300a-apu-for-hpc_4amd-instinct-mi300a-apu-for-hpc_5

Chegando aos números de desempenho, a AMD mais uma vez comparou o MI300A com o H100, mas desta vez em cargas de trabalho específicas de HPC. No OpenFOAM, a APU Instinct MI300A oferece até 4x o aumento de desempenho que vem principalmente do layout de memória unificado, desempenho da GPU e capacidade geral de memória e largura de banda. O sistema também oferece desempenho 2x por watt quando comparado aos Superchips Grace Hopper da NVIDIA.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *