APU AMD Instinct MI300A entra em produção em volume: até 4 vezes mais rápido que NVIDIA H100 em HPC, duas vezes mais eficiente
Além do MI300X para IA, a AMD também anuncia que sua APU Instinct MI300A entrou em produção em volume e deverá oferecer o desempenho de HPC mais rápido do mundo quando for lançado no próximo ano.
AMD impulsiona HPC para o próximo nível com APUs Instinct MI300A, 4X mais rápidas e mais rápidas 2X mais eficiente que NVIDIA H100
Esperamos durante anos que a AMD finalmente cumprisse a promessa de uma APU da classe Exascale e o dia se aproxima à medida que nos aproximamos do lançamento do Instinct MI300A. Hoje, a AMD confirmou que a APU MI300A entrou em produção em volume neste trimestre e está a caminho de se tornar a solução HPC mais rápida do mundo quando estiver disponível em 2024.
O APU AMD Instinct MI300A é uma combinação de várias arquiteturas e tecnologia de interconexão com a arquitetura Zen 4, CDNA 3 e 4ª Geração Infinity na vanguarda. Alguns dos destaques das APUs MI300A incluem:
- Até 61 TFLOPS de computação FP64
- Até 122 TFLOPS de computação FP32
- Até 128 GB de memória HBM3
- Largura de banda de memória de até 5,3 TB/s
- 146 bilhões de transistores
A embalagem do MI300A é muito semelhante à do MI300X, exceto que utiliza capacidades de memória e recursos otimizados para TCO. Zen 4 núcleos. Então, vamos aos detalhes dessa potência em exaescala para data centers de HPC e IA de próxima geração.
Uma das matrizes ativas tem dois GCDs CDNA 3 cortados e substituídos por três CCDs Zen 4 que oferecem seu conjunto separado de cache e IPs principais. Você obtém 8 núcleos e 16 threads por CCD, totalizando 24 núcleos e 48 threads na matriz ativa. Há também 24 MB de cache L2 (1 MB por núcleo) e um pool separado de cache (32 MB por CCD). Deve-se lembrar que os GCDs CDNA 3 também possuem o cache L2 separado.
Para o lado da GPU, a AMD habilitou um total de 228 unidades de computação baseadas na arquitetura CDNA 3, o que equivale a 14.592 núcleos. São 38 unidades de computação por chiplet GPU. Resumindo alguns dos recursos destacados dos aceleradores AMD Instinct MI300, temos:
- Primeiro pacote integrado de CPU+GPU
- Visando o mercado de supercomputadores Exascale
- AMD MI300A (CPU + GPU integrada)
- 146 bilhões de transistores
- Até 24 núcleos Zen 4
- Arquitetura de GPU CDNA 3
- 228 unidades de computação (14.592 núcleos)
- Até 128 GB de memória HBM3
- Até 8 chips + 8 pilhas de memória (processo 5nm + 6nm)
Chegando aos números de desempenho, a AMD mais uma vez comparou o MI300A com o H100, mas desta vez em cargas de trabalho específicas de HPC. No OpenFOAM, a APU Instinct MI300A oferece até 4x o aumento de desempenho que vem principalmente do layout de memória unificado, desempenho da GPU e capacidade geral de memória e largura de banda. O sistema também oferece desempenho 2x por watt quando comparado aos Superchips Grace Hopper da NVIDIA.
Deixe um comentário