NVIDIA Rubin CPX é revelada: GPU para Super IA com até 128 GB GDDR7 e 30 PFLOPs FP4

A NVIDIA anunciou uma nova classe de chips de IA na linha “CFX”, com estreia inicial na série Rubin, a próxima arquitetura em que o time verde está trabalhando. A empresa deve ter percebido que a inferência de IA é provavelmente o próximo foco em recursos de computação.

A novidade foi apresentada no AI Infra Summit, com a GPU Rubin CPX voltada para IA de longo prazo e ela deverá coexistir com as GPUs Rubin e as CPUs Vera. A NVIDIA afirma que o chip trará uma “revolução” na realização de inferências de IA com eficiência.

Essa nova adição à família Rubin também é uma nova classe de GPUs desenvolvidas especificamente para tarefas de IA, como codificação de software com milhões de tokens e GenAI.

Notícias Relacionadas:

Computação para Super IA

Créditos: NVIDIA.

O Rubin CPX possui 30 petaFLOPs de computação NVFP4, 128 GB de memória GDDR7 e estará presente no rack “exclusivo” NVIDIA Vera Rubin NVL144 CPX. O rack integrará 144 GPUs Rubin CPX, 144 GPUs Rubin e 36 CPUs Vera para fornecer oito exaFLOPs de computação NVFP4.

Este número, por si só, é 7,5 vezes maior que o do Blackwell Ultra. Além disso, com tecnologias como a Spectrum-X Ethernet, a NVIDIA planeja fornecer cargas de trabalho de inferência de IA com contexto de milhões de tokens, escalando para novos níveis de desempenho.

O sistema também oferecerá 100 TB de memória rápida e uma largura de banda de memória de 1,7 petabytes. Trata-se de um desempenho de atenção 3 vezes maior que o GB300 NVL72.

Além disso, o chip Rubin é visto como uma solução de custo relativamente baixo, considerando a integração de memória GDDR7, em vez de HBM.

Preparada para o futuro

Créditos: NVIDIA.

A NVIDIA já apresentou muitas informações sobre suas plataformas de IA Rubin de próxima geração e até mesmo divulgou sua próxima plataforma Feynman de próxima geração. Com essa novidade, a NVIDIA está garantindo que cobrirá todos os cantos da indústria de IA, deixando pouco espaço para os concorrentes.

Tratando especificamente da plataforma Rubin, a diferença entre a Vera Rubin NVL144 e Vera Rubin NVL144 CPX é a adição dos chips CPX.

A plataforma não-CPX conta com quatro GPUs Rubin, duas CPUs Vera e oferece 3,6 Exaflops de computação NVFP4, 1,4 PB/s de largura de banda HBM4, 75 TB de capacidade e está prevista para estar disponível no segundo semestre de 2026.

Plataforma CPXPlataforma não-CPX
8,0 Exaflops NVFP43,6 Exaflops NVFP4
1,7 PB/s de largura de banda de memória1,4 PB/s de largura de banda de memória
100 TB de capacidade de memória75 TB de capacidade de memória
Créditos: NVIDIA.

Em relação a cada chip, a GPU NVIDIA Rubin CPX oferecerá 30 PFLOPs de poder computacional NVFP4 AI e até 128 GB de memória GDDR7. A NVIDIA afirma ter escolhido GDDR7 em vez de HBM para o Rubin CPX devido à sua natureza econômica. Estes também vêm com capacidades NVENC e NVDNC quádruplas.

Enquanto a plataforma Rubin contará com GPUs de 2 retículos e o Rubin Ultra contará com GPUs de 4 retículos, o chip CPX contará com chip único e configuração monolítica. A tecnologia de processo permanece desconhecida, mas pode-se esperar TSMC N3 ou N2 para os chips Rubin AI.

Fonte: NVIDIA.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Rolar para cima