Atualize os Data Centers legados para cargas de trabalho de IA com refrigeração líquida RDHx

Há não muito tempo, era possível operar um Data Center e planear três, quatro ou mais ciclos de renovação de TI sem realizar atualizações significativas de energia ou arrefecimento. Agora, estamos numa nova era de computação acelerada por IA, em que as densidades de potência estão a crescer rapidamente: de uma média de cerca de 10kW por rack para servidores Cloud baseados em CPU há alguns anos, para mais de 140kW por rack no novo NVIDIA NVL72 GB300 (72 GPU) para IA.

No entanto, estes sistemas representam a vanguarda do desempenho de computação acelerada para IA, com custos elevados e concebidos para os modelos de treino mais avançados ou para inferência de IA totalmente autónoma, também recorrem ao arrefecimento líquido.

Estamos num momento em que os operadores de Data Centers empresariais e de colocation já estão a implementar modelos de inferência de IA para o design e desenvolvimento de produtos, para melhorar a experiência do cliente e para aumentar a produtividade e a inovação dos colaboradores. Estes modelos podem até operar várias modalidades de computação intensiva (imagem para texto, texto para vídeo, etc.).

As empresas que implementam modelos de inferência pretendem que estes sejam eficientes, pelo que devem ser comprimidos e ajustados para que “encaixem” na aplicação. Isto permite dimensionar corretamente ou otimizar as plataformas de computação acelerada para funcionarem a um nível de kW por rack mais baixo.

Soluções de arrefecimento para inferência de IA

Coloca-se a questão de saber se os servidores de inferência para IA devem ser arrefecidos a ar ou a líquido. A boa notícia é que muitos destes servidores têm versões com arrefecimento a ar, e existem soluções de arrefecimento para servidores a ar que permitem suportar densidades até 72kW por rack. O desafio para os Data Centers existentes é adaptar os seus sistemas atuais de arrefecimento para suportar estes racks de IA de “densidade média”.

O desempenho da solução depende do tipo de chiller e do sistema de rejeição de calor exterior instalados. Entre os sistemas populares de rejeição de calor com água fria incluem-se:

  • · Torres de refrigeração
  • · Arrefecedores secos (frequentemente com glicol)
  • · Arrefecedores secos adiabáticos.

Adaptar servidores de IA a um sistema exterior de água fria existente

Para servidores refrigerados a ar num Data Center equipado com um sistema exterior de água fria, pode utilizar-se uma solução “pronta a instalar”, chamada permutador de calor de porta traseira (RDHx). O RDHx assemelha-se a um grande radiador tecnológico e é instalado na porta traseira de uma rack de servidores. À medida que o ar quente passa através das serpentinas, o calor é transferido para a água arrefecida no interior do permutador. A água, agora mais quente, segue para o sistema de rejeição de calor do edifício ou do Data Center, para voltar a ser arrefecida.

Dependendo do tamanho e do tipo de permutador, RDHx como o Motivair ChilledDoor® conseguem arrefecer até 72kW por rack. Os RDHx são eficientes porque arrefecem o equipamento na origem, reduzindo a necessidade de ventiladores de sala com elevado consumo energético.

Para várias racks de computação acelerada equipadas com RDHx, é conveniente adicionar uma unidade de distribuição de refrigerante (CDU), seja por rack ou para vários racks. A CDU cria circuitos de líquido isolados:

  • · O circuito primário liga-se ao sistema de água fria do edifício
  • · O circuito secundário faz circular o líquido até ao RDHx e devolve o calor à CDU.

Servidores de refrigeração líquida sem sistema de água fria existente

Alguns servidores só estão disponíveis em versões com refrigeração líquida, mas talvez não queira (ou não precise de) converter todo o seu ambiente para refrigeração líquida. Para isso, existe uma etapa intermédia: a unidade de dissipação de calor (HDU) da Motivair, que permite implementar servidores refrigerados a líquido em Data Centers com ar condicionado, sem modificar a infraestrutura.

Ao contrário da CDU, que transfere o calor para o sistema de água fria do edifício, a HDU rejeita o calor diretamente para o espaço branco, onde os sistemas de climatização do edifício têm de o remover. A HDU pode atingir capacidades até 150 kW por rack, mas coloca uma carga adicional sobre o sistema de ar condicionado do Data Center e aumenta a PUE. Para além disso, o sistema de ar poderá não ter capacidade adicional para suportar este aumento de carga térmica.

RDHx para a modernização da refrigeração em Data Centers

Atualizar racks existentes de servidores refrigerados a ar com RDHx tem um custo inferior e é menos disruptivo do que migrar para servidores arrefecidos a líquido e acrescentar coletores, CDUs e chillers especiais, ou adicionar uma HDU. O arrefecimento tradicional a ar é entre 30–60% menos eficiente do que o arrefecimento com RDHx. Isto significa que, com o mesmo sistema de rejeição de calor, é possível duplicar a capacidade térmica que se consegue gerir.

Para além disso, os RDHx podem utilizar água de entrada a temperaturas mais elevadas, o que permite tirar partido do arrefecimento gratuito (free cooling) e melhorar o PUE do Data Center.

Em suma, as soluções RDHx do tipo “plug-and-play” permitem suportar racks de IA de alta densidade com arrefecimento a ar. São ideais para gerir cargas de trabalho de inferência de IA sem ter de renovar por completo a infraestrutura de arrefecimento.

Os RDHx podem ser instalados em todo o tipo de racks padrão: por exemplo, o ChilledDoor é compatível com Open19 e OCP, tornando esta tecnologia uma solução eficaz para qualquer infraestrutura de Data Center existente.

Para mais informações sobre as soluções de refrigeração para Data Centers de IA da Schneider Electric, visite o nosso website.

Adicione um comentário

Todos os campos são obrigatórios.