John Carmack, a mente lendária por trás de clássicos como Doom e Quake, continua sendo uma voz influente quando o assunto é otimização de hardware e engenharia de software.
Em uma publicação recente no X (antigo Twitter), o programador levantou uma hipótese fascinante e levemente absurda: utilizar um cabo de fibra óptica de 200 km como uma alternativa à memória RAM para alimentar modelos de inteligência artificial.
A proposta vem de encontro à crise de suprimentos, onde a largura de banda da memória é um dos principais gargalos para o treinamento e inferência de grandes modelos de linguagem (LLMs).
Carmack sugere que, em teoria, os dados em trânsito dentro de uma fibra de alta velocidade poderiam atuar como um cache L2 gigantesco, substituindo ou complementando a DRAM tradicional em cenários específicos.
Dados “voando” a 256 Tb/s
O raciocínio de Carmack baseia-se em demonstrações recentes de taxas de transferência de 256 Tb/s em fibra monomodo. Fazendo o que ele chamou de “matemática de caixa de Doom”, o engenheiro calculou que, em um cabo de 200 km, existem cerca de 32 GB de dados “armazenados” apenas pelo fato de estarem viajando de uma ponta à outra.
Com uma largura de banda de 32 TB/s, esse loop poderia alimentar continuamente os aceleradores de IA.
A inferência e o treinamento de redes neurais podem ter padrões de referência de peso determinísticos, então é divertido considerar um sistema sem DRAM, com pesos transmitidos continuamente para um cache L2 por um loop de fibra reciclado
John Carmack
Segundo Carmack, a técnica proposta trataria a memória não como um local estático, mas como um fluxo constante. Como os modelos de IA muitas vezes leem dados sequencialmente (streaming de pesos), a latência de acesso aleatório — o ponto fraco de um loop de 200 km — seria menos crítica do que a largura de banda bruta oferecida.
De volta ao futuro: memória de linha de atraso
A comunidade de hardware e engenharia rapidamente notou que a ideia de Carmack é, na verdade, uma versão moderna e fotônica das antigas memórias de linha de atraso (delay-line memory).
Em meados do século XX, computadores primitivos usavam tubos de mercúrio para propagar ondas sonoras; os dados eram mantidos no sistema simplesmente recirculando o som através do tubo.
Embora a física seja sólida, a praticidade de instalar 200 km de fibra óptica para cada unidade de processamento é questionável. Além do custo proibitivo da fibra em si, amplificadores ópticos e DSPs necessários para manter o sinal consumiriam parte da energia economizada ao desligar os pentes de DRAM.
Alguns comentaristas, incluindo Elon Musk, brincaram sugerindo o uso do vácuo como meio de transmissão (lasers no espaço), embora isso adicione uma camada extra de complexidade logística.
Leia também:
- O que são memórias HBM (High Bandwidth Memory)
- NVIDIA: O que separa aceleradores de IA e as GPU comuns?
- NVIDIA e ARM fecham parceria para levar NVLink Fusion aos chips Neoverse e turbinar Data Centers de IA
A alternativa realista: flash no lugar da RAM
Carmack, sempre pragmático apesar das devaneios teóricos, ofereceu uma solução “muito mais prática” na mesma thread.
Ele sugere agrupar chips de memória flash baratos para fornecer quase qualquer largura de banda de leitura necessária, desde que o acesso seja feito página por página e com pipelining (processamento em estágios) bem planejado.
A configuração poderia ser viável para servidores de inferência hoje, caso os fabricantes de flash e aceleradores de IA concordassem em uma interface de alta velocidade padronizada.
Isso eliminaria a necessidade de grandes quantidades de HBM (High Bandwidth Memory) ou DRAM DDR5 caríssimas, que hoje encarecem placas da NVIDIA e aceleradores da AMD.
Iniciativas acadêmicas como FlashNeuron e Augmented Memory Grid já exploram conceitos similares, tentando desacoplar a capacidade de memória do poder de computação, permitindo que IAs maiores rodem em hardwares mais acessíveis ou eficientes.
Enquanto o loop de fibra de 200 km permanece um experimento mental divertido, a busca por substituir a RAM tradicional no pipeline de IA é uma tendência real e urgente no mundo da tecnologia.
Fonte(s): John Carmack (X)


