O que é “Escala Waffle”?
Dispositivos de circuito integrado, como processadores, são feitos de chips de silício. Para criar o dispositivo, um enorme cristal de silício cilíndrico é cortado em wafers circulares. Em seguida, vários chips são gravados na superfície do wafer. Depois que os chips estão prontos, eles são verificados para encontrar blocos defeituosos e são marcados.
Os chips de trabalho são cortados do wafer e embalados como produto acabado para venda. “Saída” é o número de chips de trabalho que você obtém do wafer. Qualquer parte do wafer que for perdida devido a chips defeituosos, ou porque é sucata, deve ser substituída por dinheiro gerado a partir de chips em funcionamento.
Um chip de escala de wafer usa todo o wafer para um único processador. Parece uma ótima ideia, mas houve alguns grandes problemas.
Chips de escala de waffle pareciam impossíveis
Ao longo dos anos, houve várias tentativas de “integrar” uma pastilha de silício inteira. O problema é que o processo de fabricação do chip não é perfeito. É provável que haja defeitos em qualquer placa acabada.
Se você imprimiu várias cópias do mesmo chip em um wafer, alguns chips quebrados não são o fim do mundo. No entanto, uma CPU deve ser impecável para funcionar. Portanto, se você tentar integrar o wafer inteiro, essas desvantagens inevitáveis tornarão o chip gigante inteiro inútil.
Para contornar esse problema, os engenheiros tiveram que repensar como projetar um processador massivo que deveria funcionar como um todo. Até agora, apenas uma empresa conseguiu criar um processador funcional em escala de wafer e teve que resolver sérios problemas técnicos para que isso acontecesse.
Cérebro WSE-2
cérebro
O Wafer-Scale Engine 2 da Cerebras Systems é um chip absolutamente massivo. Ele usa um processo de 7nm semelhante aos chips de 7nm e 5nm usados em vários dispositivos, como smartphones, laptops e desktops.
O WSE-2 foi projetado como uma rede de núcleos conectados entre si por uma rede massiva de conexões de alta velocidade. Essa rede de módulos de núcleo de processador pode se comunicar mesmo se alguns dos núcleos estiverem com defeito. O WSE foi projetado para ter mais núcleos do que o anunciado para corresponder à saída esperada de cada wafer. Isso significa que, embora haja defeitos em cada chip, eles não afetam o desempenho calculado de forma alguma.
O WSE-2 foi projetado especificamente para acelerar aplicativos de IA usando uma técnica de aprendizado de máquina conhecida como “aprendizagem profunda”. Comparado aos supercomputadores modernos usados para tarefas de aprendizado profundo, o WSE-2 é várias ordens de magnitude mais rápido e consome menos energia.
Benefícios dos processadores de escala de wafer
CPUs em escala de wafer resolvem muitos dos problemas do design moderno de supercomputadores. Os supercomputadores são compostos de muitos computadores menores e mais simples conectados a uma rede. Ao projetar cuidadosamente as tarefas para esse tipo de projeto, todo esse poder de computação pode ser combinado.
No entanto, cada computador neste conjunto de supercomputadores precisa de seus próprios componentes de suporte, e a distância aumentada entre os vários pacotes de CPU individuais nessa rede cria muitos problemas de desempenho e limita os tipos de cargas de trabalho que podem ser executadas em tempo real.
Uma CPU do tamanho de um wafer integra eficientemente o poder de processamento de dezenas ou centenas de computadores em um único circuito integrado, controlado por uma única fonte de alimentação, todos alojados em um único chassi. Além disso, você ainda pode conectar em rede vários computadores do tamanho de wafers para criar um supercomputador tradicional, mas em velocidade exponencial.
Processadores de escala de wafer para o resto?
É improvável que tenhamos qualquer produto em escala de wafer para usuários comuns que não estão tentando construir um supercomputador, mas há elementos da filosofia “quanto maior melhor” evidentes também em eletrônicos de consumo.
Um ótimo exemplo é o M1 Ultra System-on-a-Chip (SoC) da Apple, que consiste em dois SoCs M1 Max conectados por uma interconexão de alta velocidade para formar um único sistema com o dobro dos recursos.
Os projetos de CPU da AMD também aproveitam os “ chiplets ”, que são blocos de um núcleo de CPU que podem ser fabricados independentemente e depois “colados” usando outro tipo de interconexão de alta velocidade. Agora que os circuitos nos processadores pararam de encolher, é hora de construí-los, e talvez até mais, com circuitos 3D complexos, em vez dos circuitos 2D mais comuns que usamos hoje.
Deixe um comentário