Microsoft apresenta o Maia 200, seu novo acelerador para IA feito em 3nm pela TSMC

A Microsoft anunciou hoje, dia 26 de janeiro, o lançamento oficial do Maia 200, nova geração de seu acelerador para IA focado em inferência. A empresa promete mais performance do que concorrentes da Amazon e da Google e muito mais eficiência do que o modelo anterior dos chips Maia.

O novo acelerador da Microsoft usa núcleos tensor FP8 e FP4 fabricados no processo de 3nm da TSMC, que já trabalhou na fabricação dos Maia 100, em 5nm. A confirmação contradiz rumores anteriores, de que a dona do Windows poderia passar para o processo Intel 18A na geração Maia 200.

Fonte: Microsoft

O componente vem acompanhado de 216GB de memória HBM3e, além 272MB de SRAM dedicada no chip. O resultado, segundo a Microsoft, é até três vezes mais performance em FP4 do que o Amazon Trainium e um desempenho FP8 acima da Ironwood, a TPU da Google. A empresa destaca ainda a eficiência do acelerador, que resultaria numa proporção “performance por dólar” 30% melhor do que o Maia 100.

Maia 200 traz suporte a diversos modelos de IA

A nova geração do acelerador Maia foi feita para infraestrutura heterogênea de IA e pode trabalhar com diversos modelos, o que inclui o GPT-5.2 da OpenAI, como seria de se esperar. Vale ressaltar que a vantagem de performance por dólar é prometida para Microsoft Foundry e Microsoft 365 Copilot.

Os Maia 200 foram feitos para se integrar de maneira direta com o Azure, e o SDK foi testado com diversas ferramentas, incluindo integração com PyTorch, compilador Triton com biblioteca kernel otimizada e acesso aos desenvolvedores para a linguagem de programação de baixo nível dos componentes.

Rack da Microsoft com novos aceleradores
Fonte: Microsoft

“Para usos de geração sintética de dados, o design único do Maia 200 ajuda a acelerar a taxa em que dados de alta qualidade e de domínio específico podem ser gerados e filtrados, alimentando o treinamento downstream com sinais mais frescos e melhor direcionados”, declara a Microsoft.

Microsoft promete escalabilidade até 6.144 aceleradores

A empresa ressalta ainda que os aceleradores Maia 200 usam um design de rede de dois níveis para escalabilidade considerado inovador. Cada componente oferece uma banda dedicada bidirecional para escala de 2,8TB/s, o que permite a criação de clusters com até 6.144 aceleradores.

Leia mais:

Outra vantagem da nova geração, segundo a Microsoft, é a velocidade de validação e implementação que foi muito melhorada em relação aos Maia 100. A companhia diz que os Maia 200 levaram menos da metade do tempo entre a criação do primeiro chip e o primeiro uso num rack, comparando com os aceleradores passados.

Via: Microsoft

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Rolar para cima