NVIDIA lança a CPU Vera, desenvolvida especificamente para agentes de IA

A NVIDIA lançou a CPU NVIDIA Vera, o primeiro processador do mundo desenvolvido especificamente para a era dos agentes de IA e do aprendizado por reforço. Conforme a empresa, ele oferece resultados com o dobro da eficiência e 50% mais rápidos do que CPUs tradicionais de grande escala.

A CPU NVIDIA Vera se apoia no sucesso da CPU NVIDIA Grace™, permitindo que organizações de todos os tamanhos e em todos os setores consigam construir fábricas de Inteligência Artificial. O objetivo é desbloquear os agentes de IA em escala.

A Vera é uma nova classe de CPU que, conforme o time verde, entrega o maior rendimento em IA. Ela também entrega responsividade e eficiência para serviços de IA em larga escala, como assistentes de programação de códigos, bem como para os agentes voltados para o consumidor final e nos ambientes corporativos.

Notícias Relacionadas:

Grandes Parceiros

Créditos: Reprodução / Chat GPT.

Entre os principais hyperscaladores que colaboram com a NVIDIA para implementar a Vera, estão Alibaba, CoreWeave, Meta e Oracle Cloud Infrastructure, bem como fabricantes globais de sistemas como Dell Technologies, HPE, Lenovo, Supermicro.

Essa ampla adoção estabelece a Vera como um novo padrão de CPU para as cargas de trabalho de IA mais importantes para desenvolvedores, startups, instituições público-privadas e empresas. Com isso, a NVIDIA espera ajudar a democratizar o acesso à IA e acelerar a inovação.

Para todos os data centers

Créditos: NVIDIA.

A NVIDIA anunciou um novo rack de CPUs Vera que integra 256 CPUs Vera com refrigeração líquida para suportar mais de 22.500 ambientes de CPU simultâneos. Cada um opera de forma independente com desempenho máximo.

Deste modo, fábricas de IA podem ser implantadas e dimensionadas rapidamente para dezenas de milhares de instâncias simultâneas e ferramentas de agentes em um único rack. O novo rack Vera é construído usando a arquitetura de referência modular NVIDIA MGX™, com suporte de 80 parceiros do ecossistema em todo o mundo.

Como parte da plataforma NVIDIA Vera Rubin NVL72, as CPUs Vera são emparelhadas com GPUs NVIDIA por meio da tecnologia de interconexão NVIDIA NVLink™-C2C, com 1,8 TB/s de largura de banda coerente. São sete vezes a largura de banda do PCIe Gen 6 para compartilhamento de dados em alta velocidade entre CPUs e GPUs.

Créditos: NVIDIA.

Além disso, a NVIDIA apresentou novos designs de referência que utilizam a Vera como CPU host para sistemas NVIDIA HGX™ Rubin NVL8, coordenando a movimentação de dados e o controle do sistema para cargas de trabalho aceleradas por GPU.

Os parceiros da Vera Systems oferecem configurações de servidor com CPU de soquete duplo e único, ideais para cargas de trabalho como aprendizado por reforço, inferência de agentes, processamento de dados, orquestração, gerenciamento de armazenamento, aplicações em nuvem e computação de alto desempenho.

Em todas as configurações, os sistemas Vera integram placas NVIDIA ConnectX SuperNIC e DPUs NVIDIA BlueField – 4 para redes, armazenamento e segurança acelerados, que são essenciais para IA orientada a agentes.

Isso permite que os clientes otimizem suas cargas de trabalho específicas, mantendo uma única pilha de software em toda a plataforma NVIDIA.

Escalando os Agentes

Combinando núcleos de CPU de alto desempenho e baixo consumo de energia, um subsistema de memória de alta largura de banda e a segunda geração da NVIDIA Scalable Coherency Fabric, a Vera permite respostas de agentes mais rápidas sob as condições extremas de utilização comuns em agentes de IA e aprendizado por reforço.

A Vera apresenta 88 núcleos Olympus personalizados e projetados pela NVIDIA. Com isso, ela oferece alto desempenho para compiladores, mecanismos de tempo de execução, pipelines de análise, ferramentas de agentes e serviços de orquestração.

Cada núcleo pode executar duas tarefas, usando o NVIDIA Spatial Multithreading, para fornecer desempenho consistente e previsível. Com isso, essa tecnologia se torna ideal para fábricas de IA multi-inquilino que executam muitos trabalhos simultaneamente.

Para aumentar ainda mais a eficiência energética, a Vera apresenta a segunda geração do subsistema de memória de baixo consumo da NVIDIA, agora baseado em memória LPDDR5X e oferecendo até 1,2 TB/s de largura de banda. Isso é o dobro da largura de banda pela metade do consumo de energia em comparação com CPUs de uso geral.

Fonte: NVIDIA.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Rolar para cima