NVIDIA avança até 35x em inferência de IA com novos racks para modelos gigantes

Durante a GTC 2026, a NVIDIA anunciou o chip Groq 3 LPX, além da plataforma de IA Vera Rubin. O Groq 3 LPX é uma LPU (Unidade de Processamento de Linguagem) projetada para aumentar a inferência de Inteligência Artificial em até 35 vezes.

Trata-se de um rack que contará com um total de 256 chips, 128 GB de SRAM e 12 TB de memória DDR5, projetado para modelos de IA com trilhões de parâmetros. E, conforme a imprensa taiwanesa, ele está sendo enviado antes do previsto, para o terceiro trimestre de 2026.

Créditos: NVIDIA.

Isso demonstra como a NVIDIA está acelerando o desenvolvimento de toda a sua plataforma Vera Rubin para atender à crescente demanda por inferência de IA, um elemento-chave para a era da IA ​​agêntica.

Notícias Relacionadas:

Planos originais

Créditos: NVIDIA.

Originalmente, a previsão eram de remessas limitadas do Groq 3 LPX para este ano. Porém, informações mais recentes da cadeia de suprimentos indicam que os chips LP30 e LP35 presentes nos racks LPX atingirão a marca de 1,5 milhão de unidades este ano e 2,5 milhões de unidades em 2027.

Além disso, a Foxconn seria a fornecedora “exclusiva” da bandeja de computação Groq 3 LPX e a principal fornecedora da montagem do gabinete LPX.

E a enorme demanda pelas plataformas Vera Rubin da NVIDIA, com os racks Groq 3 LPX, impulsionará a participação da Foxconn de 55% para 60% no segundo semestre deste ano. Consequentemente, haverá um grande crescimento na receita da empresa.

Foxconn

Créditos: Flickr / Gateway Technical College

A empresa é a maior fabricante mundial de eletrônicos, chamados de “produtos 3C”, ou seja, Computadores, Comunicações e Consumos. Também é a principal montadora de iPhones da Apple.

Com base nas estimativas iniciais, a empresa deverá entregar 6.000 racks Groq 3 LPX este ano e outros 10.000 em 2027. E isso exclui os racks LPX de próxima geração, baseados nos chips LP40, que devem começar a ser comercializados no próximo ano.

Espera-se que os racks Vera Rubin “NVL72” atinjam a marca de 12.000 unidades em 2026, tendo como principais clientes Google, Amazon AWS e Microsoft. Já a produção em massa dos servidores Vera Rubin VR200 NVL72 deverá começar até o final do terceiro trimestre de 2026.

A Foxconn também está expandindo sua produção para os mais recentes servidores de IA da NVIDIA, dada a enorme demanda. O CEO da Foxconn, Liu Yangwei, já afirmou que a empresa pode produzir mais de 1.000 gabinetes por semana e espera aumentar a capacidade de produção para 2.000 gabinetes até o final de 2026.

Fonte: UDN, com tradução do Wccftech.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Rolar para cima