Que a demanda computacional exigida pelos novos modelos de ninteligência artificial está transformando a arquitetura física dos Data Centers, não é segredo pra ninguém. Porém, agora com processadores atingindo térmicas impraticáveis para sistemas a ar, a refrigeração líquida para IA tornou-se uma prioridade estratégica para a indústria local, principalmente na China.
Empresas como a Envicool e a Vertiv disputam espaço neste momento em um mercado pressionado por clusters massivos e restrições energéticas.
Isso porque qualquer pessoa que entre em um Data Center moderno voltado para IA percebe imediatamente o impacto térmico: as fileiras de servidores, agora equipadas com processadores que consomem mais de 1.000 Watts individualmente, operam no limite do que a ventilação tradicional consegue dissipar.
Segundo relatórios recentes do South China Morning Post, essa barreira física acelerou os investimentos chineses em tecnologias de resfriamento direto (direct-to-chip) e imersão.
O fim da era da refrigeração a ar para IA
A limitação da refrigeração a ar é puramente física: o ar não possui capacidade térmica suficiente para remover o calor gerado por racks de alta densidade sem exigir um fluxo de vento ensurdecedor e energeticamente ineficiente. O chip B200 da NVIDIA, por exemplo, ultrapassa a barreira dos 1.000W.
Plataformas como a GB200 NVL72, que integra 72 GPUs Blackwell, já saem de fábrica com refrigeração líquida como padrão. Por isso, empresas chinesas listadas em bolsa, como a Envicool, viram suas ações triplicarem no último ano diante dessa necessidade.
O mercado reagiu rapidamente: os papéis da Envicool fecharam recentemente cotados a 113,14 yuans (cerca de R$ 86), impulsionados por recomendações de compra do Goldman Sachs e UBS.
Tecnologias em ascensão
- Direct-to-chip: placas frias (cold plates) circulam fluido diretamente sobre o processador.
- Imersão: componentes inteiros são mergulhados em fluidos dielétricos não condutores.
- Spray Cooling: jatos direcionados de fluido refrigerante em pontos críticos de calor.
A transição cria um novo ecossistema de hardware, demandando manifolds, unidades de distribuição de refrigerante (CDUs) e sistemas complexos de detecção de vazamentos.
Políticas governamentais e eficiência energética
O movimento chinês em direção ao líquido não responde apenas às necessidades térmicas dos chips. A iniciativa governamental “Eastern Data, Western Computing” busca transferir o processamento de dados das costas ricas para as províncias do Oeste, onde a energia renovável é abundante.
No entanto, o governo impõe metas rígidas de PUE (Power Usage Effectiveness). Sistemas líquidos reduzem drasticamente a carga dos ventiladores, melhorando esse índice.
Construir novos campi de IA (greenfield) permite aos operadores projetar instalações nativas para refrigeração líquida, evitando os custos de adaptar estruturas antigas baseadas em ar condicionado.
Leia também:
- Intel e AMD devem atrasar entregas de CPUs para servidores na China
- Ex-engenheiro do Google é condenado por vender segredos de TPUs para a China
- Pesquisadores chineses descobrem método de resfriamento com sal capaz de reduzir temperatura em mais de 50 °C em segundos
A disputa pela cadeia de suprimentos
Enquanto a americana Vertiv — que reportou vendas líquidas de US$ 13,5 bilhões (aproximadamente R$ 71 bilhões) — mantém forte parceria com a NVIDIA, a China corre para localizar sua produção.
Fabricantes como Sanhua Intelligent Controls e Lansi Technology estão adaptando suas linhas de produção para atender à demanda doméstica, principalmente considerando as contínuas restrições de exportação dos EUA.
Para os hyperscalers chineses, como Alibaba e Tencent, a estabilidade térmica é uma variável de performance. Em clusters de treinamento com milhares de placas, gradientes de temperatura podem causar variações de clock e taxas de erro, prejudicando o tempo de treinamento dos modelos.
O panorama aponta para uma convergência: a refrigeração a ar deve ficar restrita a cargas de trabalho de inferência de menor densidade, enquanto o treinamento de modelos de fronteira dependerá quase exclusivamente de fluidos.
Com clusters planejados para superar 1.500 exaflops, a eficiência térmica deixou de ser um detalhe para se tornar o gargalo que define a velocidade da evolução da IA na Ásia.
Fonte(s): South China Morning Post


