A NVIDIA anunciou uma nova classe de chips de IA na linha “CFX”, com estreia inicial na série Rubin, a próxima arquitetura em que o time verde está trabalhando. A empresa deve ter percebido que a inferência de IA é provavelmente o próximo foco em recursos de computação.
A novidade foi apresentada no AI Infra Summit, com a GPU Rubin CPX voltada para IA de longo prazo e ela deverá coexistir com as GPUs Rubin e as CPUs Vera. A NVIDIA afirma que o chip trará uma “revolução” na realização de inferências de IA com eficiência.
Essa nova adição à família Rubin também é uma nova classe de GPUs desenvolvidas especificamente para tarefas de IA, como codificação de software com milhões de tokens e GenAI.
Notícias Relacionadas:
- GeForce Now anuncia 17 jogos para setembro com Silksong, Borderlands 4 e mais – veja lista!
- RTX 5090 e PRO 6000 sofrem bug em virtualização e exigem reboot do sistema
- NVIDIA RTX Remix traz suporte ao sistema Advanced Path-Traced Particle
Computação para Super IA
O Rubin CPX possui 30 petaFLOPs de computação NVFP4, 128 GB de memória GDDR7 e estará presente no rack “exclusivo” NVIDIA Vera Rubin NVL144 CPX. O rack integrará 144 GPUs Rubin CPX, 144 GPUs Rubin e 36 CPUs Vera para fornecer oito exaFLOPs de computação NVFP4.
Este número, por si só, é 7,5 vezes maior que o do Blackwell Ultra. Além disso, com tecnologias como a Spectrum-X Ethernet, a NVIDIA planeja fornecer cargas de trabalho de inferência de IA com contexto de milhões de tokens, escalando para novos níveis de desempenho.
O sistema também oferecerá 100 TB de memória rápida e uma largura de banda de memória de 1,7 petabytes. Trata-se de um desempenho de atenção 3 vezes maior que o GB300 NVL72.
Além disso, o chip Rubin é visto como uma solução de custo relativamente baixo, considerando a integração de memória GDDR7, em vez de HBM.
Preparada para o futuro

A NVIDIA já apresentou muitas informações sobre suas plataformas de IA Rubin de próxima geração e até mesmo divulgou sua próxima plataforma Feynman de próxima geração. Com essa novidade, a NVIDIA está garantindo que cobrirá todos os cantos da indústria de IA, deixando pouco espaço para os concorrentes.
Tratando especificamente da plataforma Rubin, a diferença entre a Vera Rubin NVL144 e Vera Rubin NVL144 CPX é a adição dos chips CPX.
A plataforma não-CPX conta com quatro GPUs Rubin, duas CPUs Vera e oferece 3,6 Exaflops de computação NVFP4, 1,4 PB/s de largura de banda HBM4, 75 TB de capacidade e está prevista para estar disponível no segundo semestre de 2026.
| Plataforma CPX | Plataforma não-CPX |
| 8,0 Exaflops NVFP4 | 3,6 Exaflops NVFP4 |
| 1,7 PB/s de largura de banda de memória | 1,4 PB/s de largura de banda de memória |
| 100 TB de capacidade de memória | 75 TB de capacidade de memória |

Em relação a cada chip, a GPU NVIDIA Rubin CPX oferecerá 30 PFLOPs de poder computacional NVFP4 AI e até 128 GB de memória GDDR7. A NVIDIA afirma ter escolhido GDDR7 em vez de HBM para o Rubin CPX devido à sua natureza econômica. Estes também vêm com capacidades NVENC e NVDNC quádruplas.
Enquanto a plataforma Rubin contará com GPUs de 2 retículos e o Rubin Ultra contará com GPUs de 4 retículos, o chip CPX contará com chip único e configuração monolítica. A tecnologia de processo permanece desconhecida, mas pode-se esperar TSMC N3 ou N2 para os chips Rubin AI.
Fonte: NVIDIA.


