Atlas 950 SuperCluster: novo supercomputador da Huawei atinge 1 ZettaFLOPS

A Huawei revelou sua solução de IA de próxima geração em escala para data centers. O supercomputador pode oferecer desempenho de 1 FP4 ZettaFLOPS para inferência de Inteligência Artificial e 524 FP8 ExaFLOPS para treinamento de IA em sua conferência Huawei Connect 2025.

O novo sistema SuperCluster 950 executa centenas de milhares de unidades de processamento neural (NPUs) Ascend 950DT da empresa. Ele promete ser um dos supercomputadores para inteligência artificial mais poderosos do planeta.

Da sua parte, a Huawei espera que seu SuperCluster concorra com os sistemas baseados em Rubin da NVIDIA no final de 2026.

Notícias Relacionadas:

Desempenho

Fonte: Reuters.

O Atlas 950 SuperCluster da Huawei é composto por 64 Atlas 950 SuperPoDs, que são as soluções de IA em escala de rack da empresa. Trata-se de uma tecnologia semelhante ao GB300 NVL72 da NVIDIA ou ao Vera Rubin NVL144 de última geração.

Ele será construído com 524.288 aceleradores de IA Ascend 950DT distribuídos em mais de 10.240 gabinetes opticamente interconectados.

Supostamente, ele oferece até 524 ExaFLOPS FP8 para treinamento de IA e até 1 ZettaFLOPS FP4 para inferência de IA. Isso o coloca logo atrás de supercomputadores de IA de ponta, como o OCI Supercluster da Oracle, que executa 131.072 GPUs B200 e oferece desempenho máximo de até 2,4 ZettaFLOPS FP4 para inferência.

Créditos: Huawei.

Este SuperCluster foi projetado para suportar os protocolos RoCE (Remote Direct Memory Access over Converged Ethernet) e UBoE (UnifiedBus over Ethernet) proprietários da Huawei, embora ainda não se saiba com que rapidez este último será adotado.

No marketing, a Huawei posiciona o Atlas 950 SuperCluster para suportar cargas de trabalho de treinamento e inferência para modelos de IA com centenas de bilhões a dezenas de trilhões de parâmetros. A empresa acredita que esta plataforma é adequada para a próxima onda de modelos densos e esparsos em larga escala

No entanto, dado seu tamanho, não está claro quantas empresas serão capazes de acomodar o sistema.

Abordagem de Força Bruta

Créditos: Huawei.

A Huawei admite que não consegue construir processadores que desafiem as GPUs da NVIDIA em termos de desempenho. Isso significa que, para atingir 1 ZettaFLOPS com o Atlas 950 SuperCluster, a empresa pretende usar uma abordagem de força bruta.

Ou seja, ela pretende utilizar centenas de milhares de aceleradores de IA para competir com clusters baseados em NVIDIA Rubin.

Um componente comum do Atlas 950 SuperCluster da Huawei é o Atlas 950 SuperPoD, que integra 8.192 chips Ascend 950DT. Isso representa um aumento de 20 vezes nas unidades de processamento em comparação com o Atlas 900 A3 SuperPoD.

Créditos: Huawei.

Se, no papel, o desempenho do Atlas 950 SuperCluster é realmente impressionante no papel, ele tem um custo: o tamanho.

A configuração de um Atlas 950 SuperPoDs inclui 160 gabinetes no total — 128 para computação e 32 para comunicações — distribuídos em 1.000 metros quadrados, o que equivale aproximadamente ao tamanho de duas quadras de basquete.

Créditos: NVIDIA.

Em contraste, o Vera Rubin NVL144 da NVIDIA é uma solução em escala de rack que requer apenas alguns metros quadrados de espaço.

O Atlas 950 SuperCluster da Huawei consiste em 64 Atlas 950 SuperPoDs e deve medir cerca de 64.000 m². Seu tamanho é comparável a 150 quadras de basquete. Isso sem considerar que ele ainda exigiria espaço adicional para salas de energia, torres de resfriamento, sistemas de baterias/UPS e escritórios de suporte.

Fonte: Huawei.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Rolar para cima