NVIDIA entrega primeiras CPUs Vera Rubin IA para os parceiros

A NVIDIA começou a entregar amostras de sua plataforma Vera Rubin para data centers de Inteligência Artificla de última geração a clientes selecionados. O anuncio foi feito pela empresa em sua teleconferência de resultados durante o dia de ontem.

Assim que os parceiros da empresa qualificarem e validarem a nova plataforma, poderão iniciar os preparativos para sua implementação. A previsão é para o segundo semestre de 2026 ou início de 2027.

Isso significa quase certamente que as especificações de desempenho e consumo de energia dos componentes já foram definidas. Porém, ainda não se sabe se a empresa acabou atualizando o desempenho de suas GPUs para consolidar sua liderança.

Rumores sugerem que a Nvidia pretende enviar aos seus parceiros bandejas de computação VR200 de nível 10 (L10) totalmente montadas, com CPUs Vera e GPUs Rubin, sistemas de refrigeração e interfaces pré-instalados. Na prática, isso deve deixar pouca liberdade de projeto e integração para seus ODMs.

Notícias Relacionadas:

Características

Fonte: NVIDIA

A plataforma Vera Rubin da NVIDIA é a arquitetura de próxima geração da empresa para data centers de IA, que inclui uma CPU Vera de 88 núcleos, GPU Rubin com 288 GB de memória HBM4, GPU Rubin CPX com 128 GB de GDDR7.

Ela também vem com ASIC de switch NVLink 6.0 para conectividade escalável em racks, DPU BlueField-4 com SSD integrado para armazenamento de cache de chave-valor, Ethernet Spectrum-6 Photonics e NICs InfiniBand Quantum-CX9 Photonics de 1,6 Tb/s.

As configurações ainda incluem Ethernet Spectrum-X Photonics e switches InfiniBand Quantum-CX9 Photonics para conectividade escalável horizontalmente.

Consequentemente, para se prepararem para a chegada da plataforma Vera Rubin, os parceiros da empresa precisam adaptar seus softwares e hardwares. Assim, diferentes parceiros receberão diferentes partes da plataforma, enquanto alguns receberão racks NVL72 VR200 com todos os componentes mencionados.

Além disso, amostras de silício real também serão enviadas a parceiros de hardware, como Foxconn, Quanta, Supermicro, Wistron e outros fabricantes renomados de servidores de IA.

EspecificaçãoNVIDIA Vera Rubin NVL72NVIDIA Vera Rubin SuperchipNVIDIA Rubin GPU
Configuração72 GPUs NVIDIA Rubin | 36 CPUs NVIDIA Vera2 GPUs NVIDIA Rubin | 1 CPU NVIDIA Vera1 GPU NVIDIA Rubin
Inferência NVFP43.600 PFLOPS100 PFLOPS50 PFLOPS
Treinamento NVFP42.520 PFLOPS70 PFLOPS35 PFLOPS
Treinamento FP8/FP61.260 PFLOPS35 PFLOPS17,5 PFLOPS
INT818 POPS0,5 POPS0,25 POPS
FP16/BF16288 PFLOPS8 PFLOPS4 PFLOPS
TF32144 PFLOPS4 PFLOPS2 PFLOPS
FP329.360 TFLOPS260 TFLOPS130 TFLOPS
FP642.400 TFLOPS67 TFLOPS33 TFLOPS
FP32 SGEMM28.800 TFLOPS800 TFLOPS400 TFLOPS
FP64 DGEMM14.400 TFLOPS400 TFLOPS200 TFLOPS
Memória GPU | Largura de Banda20,7 TB HBM4 | 1.580 TB/s576 GB HBM4 | 44 TB/s288 GB HBM4 | 22 TB/s
Largura de Banda NVLink260 TB/s72 TB/s3,6 TB/s
Largura de Banda NVLink-C2C65 TB/s1,8 TB/s
Núcleos de CPU3.168 núcleos NVIDIA Olympus personalizados (compatíveis com Arm)88 núcleos NVIDIA Olympus (compatíveis com Arm)
Memória da CPU54 TB LPDDR5X1,5 TB LPDDR5X
Total de Chips NVIDIA + HBM41.2963012

Fonte: NVIDIA.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Rolar para cima

Review My Order

0

Subtotal