As contagens modernas de transistores de CPU são enormes – a AMD anunciou no início deste mês que uma implementação completa de seu CPU Epyc “Rome” de 7nm leva 32 bilhões de transistores. Para isso, a Cerebras Technology diz: “Segure minha cerveja”. A empresa focada em IA projetou o que chama de Wafer Scale Engine. O WSE é uma placa de aproximadamente 20 cm por 30 cm e contém aproximadamente 1,2 trilhão de transistores.
É surpreendente ver uma empresa lançando um produto em escala de wafer para comercializar. A ideia do processamento em escala de wafer chamou recentemente a atenção como uma solução potencial para as dificuldades de escala de desempenho.
Os pesquisadores avaliaram a ideia de construir uma GPU enorme na maioria ou na totalidade de um wafer de 100 mm. Eles descobriram que a técnica pode produzir processadores viáveis e de alto desempenho e que também pode ser dimensionada de maneira eficaz para tamanhos de nós maiores. O Cerebras WSE definitivamente se qualifica como grande – sua área total de superfície é muito maior do que os projetos hipotéticos que consideramos no início deste ano. Não é um wafer de tamanho grande de 300 mm, mas possui uma área de superfície maior do que uma de 200 mm.
A maior GPU apenas para comparação, mede 815 milímetros quadrados e comporta 21,1 bilhões de transistores. Portanto, o Cerebras WSE é um pouco maior. Algumas empresas enviam fotos de seus chips ao lado de um objeto comum. Cerebras enviou uma foto da sua placa ao lado de um teclado.
O Cerebras WSE contém 400.000 núcleos de álgebra linear esparsos, 18 GB de memória total no molde, 9PB/s de largura de banda de memória no chip e largura de banda de tecido separada de até 100Pbit/s. Todo o chip é construído no processo FinFET de 16 nm da TSMC. Como o chip é construído a partir de (a maioria) de único wafer, a empresa implementou métodos de roteamento em torno de núcleos ruins na matriz e pode manter suas matrizes conectadas, mesmo que possua núcleos ruins em uma seção do wafer. A empresa diz que possui núcleos redundantes implementados no molde, embora ainda não tenha discutido detalhes. Detalhes sobre o design ainda estão sendo analisados.
O WSE – “CPU” simplesmente não parece suficiente – é resfriado usando uma placa fria maciça acima do silicone, com tubos de água montados verticalmente usados para o resfriamento direto. Como não há um pacote grande o suficiente para caber no chip, a Cerebras projetou seu próprio. A PCWorld a descreve como “combinando uma placa de circuito impresso, o wafer, um conector personalizado que liga as duas e a placa fria”. Os detalhes do chip, como seu desempenho bruto e consumo de energia, ainda não estão disponíveis.
Um processador de escala de wafer totalmente funcional, comercializado em escala, seria uma demonstração empolgante de se essa abordagem tecnológica tem alguma relevância para o mercado em geral. Embora nunca veremos os componentes vendidos dessa maneira, houve interesse em usar o processamento em escala de wafer para melhorar o desempenho e o consumo de energia em vários mercados.
Se os consumidores continuarem movendo cargas de trabalho para a nuvem, especialmente cargas de trabalho de alto desempenho, como jogos, não é loucura pensar que um dia veremos os fabricantes de GPUs aproveitando essa idéia – e construindo matrizes de peças que nenhum indivíduo jamais poderia dar ao luxo de usar a nuvem nos sistemas de jogos no futuro.
Achou útil essa informação? Compartilhe com seus amigos! xD
Deixe-nos a sua opinião aqui nos comentário.