NVIDIA e Kioxia planejam SSD de 100 milhões de IOPS até 2027 para servidores de IA

A Kioxia está trabalhando com a NVIDIA para desenvolver um SSD que fornecerá 100 milhões de IOPS aleatórios já em 2027. As informações são do Nikkei, com tradução do Tom’s Hardware. E a NVIDIA planeja usar esses SSDs conectados diretamente às suas GPUs para aumentar o desempenho da IA.

Isso deve totalizar impressionantes 200 milhões de IOPS. Lembrando que a NVIDIA tem investido pesado em IA, revelando a Rubin CPX ainda nesta semana.

Os dispositivos da Kioxia com velocidades de leitura aleatória de 100 milhões estão projetados para usar uma interface PCIe 7.0 e para se conectarem às GPUs em modo ponto a ponto. Eles serão projetados exclusivamente para uso em servidores de IA que precisam acessar e processar grandes quantidades de dados rapidamente.

Notícias Relacionadas:

SSD de 100 milhões de IOPS

Créditos: Divulgação

Atualmente, os melhores SSDs alcançam cerca de 3 milhões de IOPS aleatórios de 4K. Porém, para atender às necessidades de desempenho das GPUs modernas e futuras, elas precisam se tornar substancialmente mais rápidas e mudar a maneira como interagem com a mídia NAND.

As cargas de trabalho de IA dependem de leituras aleatórias, pequenas e frequentes para recuperar embeddings, parâmetros de modelo ou entradas de banco de dados. Nesses casos, blocos de 512 bytes representam melhor os padrões reais de uso do que blocos de 4 KB e oferecem menor latência.

Créditos: Kioxia

Unidades que operam blocos de 512B podem não fornecer a mesma largura de banda bruta que SSDs típicos com blocos de 4K. Porém, é mais fácil escalar as velocidades de leitura/gravação sequencial com várias unidades do que reduzir as latências de SSDs convencionais.

A única informação que não está clara é se o SSD para IA da Kioxia com desempenho aleatório de 10 milhões de IOPS de 512K se materializará em 2026. Ainda mais considerando o plano da empresa de construir unidades com desempenho aleatório de 100 milhões de IOPS para 2027.

XL-Flash como solução?

Fonte: Kioxia

O SSD é baseado em XL-Flash, que é uma memória NAND SLC com alta resistência, latência muito baixa e desempenho bastante alto. Os dispositivos XL-Flash da Kioxia apresentam 16 planos. Para se ter uma ideia, dispositivos NAND 3D modernos para PCs usam 6. E isso indica um desempenho sequencial e aleatório superior.

Como a Kioxia não publica especificações de XL-Flash, é impossível avaliar o desempenho desse tipo de memória por dispositivo.

Tome-se por base um SSD XL-Flash de 400 GB baseado em Innogrit Tacoma com 32 chips NAND e uma interface PCIe 5.0 x4, que alcança 3,5 milhões de IOPS de leitura aleatória e 0,5 milhão de gravação aleatória. Assim, é possível estimar que cada chip contribui com até 109.375 IOPS de leitura aleatória e 15.625 IOPS de gravação aleatória.

Créditos: Divulgação.

Neste contexto, um escalonamento linear perfeito entre cargas de dispositivos NAND, um SSD de 100 milhões de IOPS de 512 B exigiria 915 desses chips.

A Kioxia sabe como agrupar 32 CIs NAND em um único pacote, certamente pode construir um drive baseado em 915 CIs XL-Flash. Tal drive exigiria um controlador especial com pelo menos uma interface host PCIe 5.0 x16.

Créditos: Kioxia.

O problema é que não existe escalonamento linear perfeito. O desempenho real de dispositivos NAND em SSDs é limitado pela largura de banda do canal, restrições multiplano, pipeline/overheads de comando, profundidade da fila, firmware e vários outros fatores.

Isso significa que o melhor cenário para um SSD de 100 milhões de IOPS de 512B com dispositivos XL-Flash é um módulo multicontrolador com dezenas de controladores e um switch. Tal solução pode fazer sentido em matrizes totalmente flash, mas a Kioxia está falando explicitamente de um SSD.

HBF?

Créditos: Divulgação/SanDisk

Como o uso de memória NAND 3D tradicional para um SSD de 100 milhões de IOPS com blocos de 512 bilhões não é exatamente viável, a Kioxia pode recorrer a tecnologias emergentes que utilizem memória NAND de forma não convencional.

Uma dessas tecnologias é provavelmente o flash de alta largura de banda (HBF), que reúne até 16 dispositivos NAND e um chip lógico em uma única pilha e os interconecta usando TSVs e microbumps.

Embora as camadas HBF ainda utilizem células de memória NAND, elas são organizadas em múltiplos arrays para atingir um nível muito alto de paralelismo e, portanto, de desempenho. Porém, não está claro se a Kioxia planeja usar HBF no projeto.

Itens Mais acessíveis

SSDs já foram itens difíceis de serem obtidos para uso doméstico. Nos últimos tempos, mesmo com a inflação, eles ficaram mais acessíveis e, hoje, já substituem HDs em muitos computadores.

Alguns ainda utilizam os SSDs Sata, significativamente mas acessíveis. Porém, mesmo os modelos M.2 também já ficaram mais comuns (e baratos).

Créditos: Kingston/Divulgação

Na Kabum, é possível encontrar com várias capacidades, velocidades e preços:

  • Adata Legend 710, 512GB, M.2 2280 – R$ 279,99
  • Kingston 1TB Nv3 M.2 – R$ 391,50
  • Kingston NV3, 1 TB, M.2 2280 – R$ 459,99
  • Rise Mode Gamer M.2 Z Series Pro 1TB M.2 – R$ 554,99
  • Kingston Fury Renegade 1TB, M.2 2280 – R$ 699,99
  • Kingston Fury Renegade, 4TB, M.2 2280 – R$ 2.836,99

No caso de modelos SATA, é possível encontrar modelos ainda mais acessíveis:

Fonte: Nikkei, com tradução do Tom’s Hardware.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Rolar para cima