Qualcomm lança chips de IA para bater de frente com a NVIDIA

A Qualcomm revelou nesta segunda-feira, dia 27, dois novos chips voltados para inteligência artificial. Trata-se de uma tentativa da empresa para conquistar espaço em um setor dominado pela NVIDIA.

O AI200 e o AI250 foram projetados para execução de modelos já treinados, ou seja, inferência, e não para o treinamento de redes neurais.

O lançamento representa uma guinada estratégica para a empresa, historicamente associada à fabricação de processadores mobile e componentes de telecomunicações. Claramente, a Qualcomm quer garantir sua presença no mercado de data centers e no mercado de infraestrutura de Inteligência Artificial.

Porém, ela tem o desafio de concorrer com gigantes como NVIDIA e AMD.

Notícias Relacionadas:

Cartas na mesa

Créditos: Qualcomm.

Esses novos processadores são baseados na tecnologia Hexagon NPU, utilizada em dispositivos mobile e notebooks da marca. Evidente que eles sofreram adaptações para aplicações em larga escala. Até 72 chips podem operar em conjunto dentro de um mesmo rack.

Como resultado, eles simulam o funcionamento de um supercomputador e configurando uma estrutura semelhante à empregada pelas GPUs da NVIDIA.

Créditos: Qualcomm.

O AI200 está previsto para chegar ao mercado em 2026 e contará com 768 GB de memória LPDDR por placa. O desempenho será otimizado para inferência de modelos generativos e multimodais.

Já o AI250 deve estrear em 2027 e trará uma nova arquitetura de memória com eficiência aprimorada e menor consumo de energia.

Em tese, ele será capaz de entregar até dez vezes mais largura de banda efetiva de memória, além de oferecer refrigeração líquida direta, suporte a PCIe e Ethernet para escalabilidade, além de potência total de até 160 kW por rack.

Competição possível?

Créditos: NVIDIA.

A NVIDIA domina o mercado de chips para IA, especialmente com soluções para treinamento que são altamente procuradas pelas empresas que estão desenvolvendo os LLMs. Nesse sentido, a aposta da Qualcomm recai sobre o segmento de inferência.

Trata-se de uma etapa que fica cada vez mais relevante à medida que modelos generativos passam a ser amplamente utilizados em empresas e serviços.

Os novos processadores fazem parte do plano da Qualcomm de lançar gerações anuais de soluções de IA para data centers. Com eles, a empresa reforça sua estratégia de oferecer alternativas mais eficientes e econômicas às opções dominadas pela NVIDIA.

Assim, o foco da empresa está em garantir alto desempenho de inferência com baixo consumo de energia e excelente custo-benefício. Para computadores domésticos, uma diferença de 2 Watts é irrelevante, mas para empresas que planejam vários, 2 Watts por rack funcionando 24 horas por dia acumulam altos valores e rápido.

Fonte: Qualcomm.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Rolar para cima