Muitas, se não a maioria das organizações, dependem tanto dos seus data centers que eles precisam funcionar ininterruptamente 24×7. Em um esforço para evitar paralisações, as organizações integram redundância. Mas vários tipos de falhas de equipamentos podem condenar até mesmo os melhores planos.
Uma maneira eficaz de evitar essas falhas é implementar uma estratégia de manutenção preventiva (MP). A MP envolve inspeções regulares da infraestrutura do data center, incluindo os sistemas de energia e refrigeração, para assegurar que eles estejam funcionando conforme o esperado, e fazer os necessários os ajustes necessários de rotina ou substituições de peças. Também é uma oportunidade para verificar os sinais de desgaste que anunciam falhas futuras nos equipamentos.
Com base no meu trabalho no grupo da Field Services da Schneider Electric, vejo três abordagens principais de MP que se tornam cada vez mais avançadas e eficazes entre os nossos clientes.
No nível mais básico, estão os planos de serviço que os fabricantes oferecem com suas soluções de infraestrutura de data centers. Se você tem um plano de serviço para o seu sistema de refrigeração, por exemplo, um técnico aparecerá para verificar o sistema e fazer as atualizações necessárias duas vezes por ano, visando garantir que ele esteja funcionando como deveria, conforme as características técnicas. (Ou, se algo der errado, você pode chamá-lo, mas este é o tipo de manutenção corretiva que um plano de MP pretende evitar.)
Um passo acima desse é um plano no qual você identifica a infraestrutura de data center mais crítica para a sua organização e certifica-se de realizar a manutenção desses componentes rotineiramente. Isso significa identificar as aplicações de TI que são mais críticas para o negócio, e então determinar qual infraestrutura de data centers é crucial para manter as aplicações em funcionamento. Posteriormente, você pode implementar um plano de manutenção preventiva nesses componentes. Isso implica seguir um cronograma para substituir os componentes consumíveis, tais como baterias, ventiladores e capacitores de nobreaks que normalmente não são cobertos pelo seu contrato de manutenção, mas são críticos para o funcionamento geral dos data centers. Se, por exemplo, um capacitor falhar, ele pode ou não colocar o sistema no modo de bypass, expondo as cargas a jusante. Em um sistema de ar-condicionado o mal funcionamento de um ventilador pode acarretar no aumento da temperatura do data-center ou em um consumo maior de energia das outras máquinas de ar-condicionado que terão que suprir a máquina com ventilador defeituoso. Um nobreak com baterias mais velhas pode não fornecer o tempo de autonomia suficiente até a transferência para o gerador.
Ao criar um plano de Manutenção Preventiva, é importante obter informações detalhadas sobre os equipamentos efetivos que você tem instalados e mantê-los de acordo com as características técnicas recomendadas pelo fabricante. Também é uma boa ideia estocar componentes essenciais para qualquer infraestrutura crítica, para que você possa realizar o reparo mais rapidamente em caso de uma falha. Embora o reparo em si pudesse ser considerado uma manutenção corretiva, preparar-se para realizá-lo rapidamente é parte do plano de MP.
Finalmente, conforme a infraestrutura de data centers torna-se tecnologicamente mais avançada, outro tipo de serviço está surgindo, chamado de serviço de monitoramento remoto (RMS). Cada vez mais, as infraestruturas mais modernas são capazes de informar remotamente o estado dos seus equipamentos. Essas informações podem ser muito úteis para a notificação proativa de quaisquer anormalidades e para que o cliente saiba exatamente o que está passando no seu sistema. Esse serviço é realiz-ado pelo fabricante do equipamento com a ajuda de profissionais qualificados e treinados na identificação de alarmes e possíveis falhas.
A qualquer sinal de anormalidade a equipe que trabalha 24×7 é acionada e conforme a criticidade da falha disparara um atendimento emergencial.
Manter a infraestrutura de data centers nas melhores condições de funcionamento é crucial para a disponibilidade 24×7 de sistemas de TI. Elaborar uma estratégia de MP sólida que inclua as abordagens expostas acima pode ajudar a assegurar que a sua infraestrutura não seja a causa do tempo de paralisação oneroso.
Adicione um comentário