Cargas de trabalho de IA e refrigeração líquida direta ao chip: o futuro do HPC

A Inteligência Artificial (IA) está a impulsionar mudanças transformadoras em praticamente todos os setores, melhorando desde a análise preditiva de finanças até às ferramentas de diagnóstico na área da saúde. Estes avanços dependem de algoritmos complexos e de grandes conjuntos de dados utilizados pelos Grandes Modelos de Linguagem (LLM, na sua sigla em inglês), que aumentam significativamente as exigências computacionais. À medida que as aplicações de IA se multiplicam, estão a levar a computação de alto desempenho (HPC, na sua sigla em inglês) ao limite, exigindo uma gestão térmica avançada para o volumente de trabalho dos LLM e soluções de infraestrutura diretas ao chip (direct-to-chip).

Gestão térmica avançada para LLM

Desafios da geração de calor em ambientes de IA e HPC

Os ambientes de IA e HPC geram muito mais calor do que a informática tradicional, o que implica desafios significativos para os Data Centers de IA. Atualmente, a densidade média de potência por rack ronda os 15kW/rack, mas prevê-se que o volume de trabalho de IA e de LLM aumentem esta densidade para valores entre 60 e 120kW/rack, segundo estimativas do setor.

Os métodos tradicionais de refrigeração por ar não vão ser suficientes, especialmente com as cargas térmicas elevadas produzidas pelos processadores modernos de IA. Uma gestão térmica eficaz para o volume de trabalho dos LLM, é crucial para manter um desempenho e uma fiabilidade excelentes. O sobreaquecimento pode causar falhas nos equipamentos e reduzir a vida útil dos componentes críticos.

Vantagens das soluções de refrigeração líquida direta ao chip

Como a refrigeração líquida supera a refrigeração por ar

As soluções direct-to-chip que utilizam refrigeração líquida para dissipar o calor oferecem várias vantagens em comparação com a refrigeração por ar. A principal é que a refrigeração líquida pode ser até 3.000 vezes mais eficaz do que o ar na captação do calor. Outros benefícios incluem:

  • Eficiência energética: utiliza muito menos energia do que os métodos tradicionais de refrigeração em Data Centers.
  • Máximo desempenho: permite manter um desempenho ideal, mesmo com níveis elevados de potência por processador.
  • Segurança: recorre a fluidos à base de água ou não condutivos, criando ambientes mais seguros para pessoas e equipamentos.
  • Impacto ambiental: reduz as emissões de carbono, poupa energia e diminui a poluição sonora, reduzindo a dependência de sistemas como chillers, condensadores e sistemas CRAC/CRAH.

Ao absorver e dissipar diretamente o calor dos componentes mais quentes, como GPUs e chipsets de IA, a refrigeração líquida oferece uma gestão térmica de qualidade superior. Para além disso, mantém os processadores de IA a temperaturas ideias para o seu funcionamento, melhorando o desempenho e a fiabilidade.

Soluções de gestão térmica de última geração da Schneider Electric

Unidades de Distribuição de Refrigerante (CDUs)

As CDUs da Motivair by Schneider Electric distribuem o refrigerante de forma eficiente pelo Data Centers, com capacidades de refrigeração entre 105kW e 2.3MW – essenciais para gerir as cargas térmicas dos LLM e processadores de IA.

ChilledDoor® Rear Door Heat Exchangers (RDHx)

Este produto inovador fornece refrigeração a pedido, utilizando ar arrefecido por líquido para eliminar o calor de processadores de alta potência, com capacidade até 75kW.

Dynamic® Cold Plates

Concebidos para uma escalabilidade fácil, estes componentes de soluções direct-to-chip oferecem um desempenho excecional, com capacidade para arrefecer processadores com saídas térmicas até +1.500W. São compatíveis com modelos AMD, NVIDIA, Intel ou silício personalizado.

In-Rack Manifolds

Coletores personalizados em aço inoxidável que permitem a circulação entre as placas frias (cold plates) e as CDUs, garantindo uma integração fluida e uma distribuição eficiente do refrigerante.

Refigeredores centrífugos sem óleo

À medida que as necessidades de refrigeração aumentam nos Data Centers, a eficiência passa a ser tão importante  como a capacidade. Estas soluções de free cooling, ar-água ou água-água ajudam a poupar energia e a reduzir emissões, oferecendo até 2.5MW de capacidade e pontos de regulação até 33°C para aplicações de refrigeração por ar e líquido.

Tendências futuras de IA e gestão térmica para LLM

À medida que a IA evolui, a procura por uma gestão térmica eficiente vai continuar a crescer. A Schneider Electric e a Motivair estão empenhadas em antecipar estas necessidades através de inovação constante nas soluções direct-to-chip. As soluções de refrigeração sustentáveis vão ter um papel fundamental no futuro da IA e do HPC, garantindo sistemas mais eficientes e fiáveis. Os especialistas prevêem que a integração de soluções avançadas de refrigeração vai ser essencial para impulsionar a próxima geração de avanços em IA.

Avançar com a IA

Garantir um desempenho fiável com gestão térmica avançada

A combinação de IA e soluções direct-to-chip representa uma sinergia perfeita para a computação de alto desempenho. À medida que as aplicações de IA crescem e as exigências computacionais aumentam, as soluções de refrigeração avançadas tornam-se essenciais. Os produtos de refrigeração líquida da Schneider Electric oferecem a gestão térmica necessária para manter o volume de trabalho dos LLM e os sistemas de IA a funcionarem de forma eficiente e estável.

Para quem procura melhorar a fiabilidade e o desempenho dos seus ambientes de IA e HPC, a Schneider Electric oferece soluções completas para enfrentar estes desafios de forma direta.

Adicione um comentário

Todos os campos são obrigatórios.