Case cliente Facebook: O compartilhamento foi a chave para resolver problemas com arco Elétrico

Texto traduzido livremente do link citado

https://datacenterfrontier.com/facebook-open-sharing-was-key-to-addressing-arc-flash-incidents/

Imagem de um duto de barras no data center de Lulea do depois de um incidente com arco elétrico em 2014. A companhia apresentou uma resposta ao incidente durante a semana de conferência 7×24 Exchange Fall. (Image: Facebook)

PHOENIX, Arizona – Operadores de data centers não gostam de falar publicamente sobre falhas. No topo da lista dessas falhas indesejáveis ​​está o arco elétrico.

É por isso que foi notável quando executivos do Facebook e Schneider Electric subiram ao palco na conferência 7×24 Exchange Fall desta semana para discutir dois incidentes de arco elétrico no data center do Facebook na Suécia, e como a análise e resposta pós-evento da empresa partiu de outros incidentes potenciais.

Um arco elétrico é uma explosão elétrica que gera calor intenso que pode chegar a aproximadamente 20.000Cº, o que pode danificar e até mesmo derreter equipamentos elétricos. Os incidentes de arco elétrico também representam uma ameaça significativa à segurança dos trabalhadores.

“A maneira como falamos sobre as falhas é importante”, disse James Swensen, gerente sênior de operações de instalações globais do Facebook. “Ambas as organizações estavam preocupadas em compartilhar essa história. Ninguém queria que mostrássemos uma foto.

“É desconfortável”, continuou ele. “Não é divertido, mas se você não passar por essa dor, você não chegará às lições aprendidas. ”

Arco Elétrico em duto de barras

Os incidentes de arco elétrico ocorreram em 2014 e 2015 durante a operação do primeiro Data Center internacional do Facebook em Lulea, na Suécia. Ninguém ficou ferido em nenhum dos incidentes e, como os eventos foram limitados a só uma das quatro salas elétricas da instalação, o data center nunca ficou off-line.

Mesmo assim, um arco elétrico é um evento dramático em um data center, onde a infraestrutura de energia lida com enormes quantidades de eletricidade. Cada sala de dados dentro de uma instalação do Facebook abriga dezenas de milhares de servidores. Como resultado, o custo potencial dos erros é alto.

Os incidentes em Lulea ocorreram em um duto de barras suspenso, um recinto que abriga barras de cobre para conduzir eletricidade, que distribui energia dentro do data center. O barramento de 5.000A foi montado em seções com 3,0mts de comprimento e pesando 320kg. Essas seções devem ser erguidas e montadas ao longo do duto de barras.

A complexidade da montagem foi aumentada pelo grande número de partes envolvidas na instalação, de acordo com a Schneider Electric, que não participou da montagem inicial, mas foi levada para a análise pós-evento. “Este não é um projeto típico de dutos de data center”, disse Bill Westbrock, gerente global de contas da Schneider Electric. “É muita energia em um espaço pequeno.”

Emissão: Torqueamento de conexões de dutos de barras.

A análise focou nas conexões dos dutos de barras, onde as secções se juntavam. A análise de Schneider descobriu que os parafusos que prendem a junta não foram apertados adequadamente durante a montagem. Com o tempo, isso criou um efeito de “avalanche térmica” que levou a junção a falhar. Aqui está um diagrama da apresentação:

Um diagrama de como o aperto inadequado de um parafuso em uma conexão de barramento levou a um arco elétrico. (Imagem: Facebook, Schneider Electric)

A análise permitiu duas ações principais. A primeira foi uma revisão das conexões dos dutos de barras nas instalações da Lulea e de todos os outros data centers do Facebook usando esse projeto.

“Em questão de horas e dias, as pessoas em outros prédios com dutos de barras semelhantes estavam verificando os problemas que havíamos encontrado”, disse Swensen.

A análise revelou três outros locais nas instalações do Facebook, onde os parafusos das articulações não foram devidamente apertados. Swensen diz que está convencido de que isso evitou incidentes adicionais de arco elétrico.

A análise de causa raiz da Schneider Electric encontrou “muitos potenciais pontos de falha”, em uma análise detalhada de como um parafuso de conexão acabou não sendo corretamente apertado. Entre as questões levantadas na revisão estava a inadequadas analises termográficas periódicas, projetadas para identificar “pontos quentes” de problemas emergentes em conexões de duto de barras.

Em resposta, a Schneider projetou sensores de temperatura sem fio que poderiam ser instalados ao longo do duto de barras para fornecer monitoramento térmico em tempo real ao longo das conexões dos dutos de barras e emitir alertas. Aqui está uma resumo da solução:

Endereçando Arcos elétricos em Data Centers

As interrupções por arcos elétricos custaram muito aos data centers, um dos mais notáveis o incidente de 2009 no Fisher Plaza, em Seattle, que derrubou um importante portal de pagamento on-line, desacelerando o comércio eletrônico global. O evento foi atribuído a uma falha de isolamento em um duto de barras, e custou ao proprietário do edifício $6,8 milhões em despesas relacionadas ao incêndio, incluindo remediação e projetos de capital.

Houve uma série de incidentes de arco elétrico durante a construção e testes do data center da NSA em Utah, de acordo com relatos da mídia, segundo os quais, os eventos causaram danos significativos aos equipamentos.

O maior perigo com o arco elétrico é a segurança do trabalhador. De acordo com a Sociedade Americana de Engenheiros de Segurança, mais de 3.600 trabalhadores sofrem lesões por elétricidade anualmente.

Reduzir os riscos de arco elétrico tem sido uma prioridade crescente para os fornecedores de energia dos data centers e para a National Fire Protection Association (NFPA), que em 2012 introduziu novas regulamentações destinadas a limitar os cenários em que os técnicos trabalham com equipamentos energizados. Também tem sido um tema em destaque nas conferências do setor, que destacaram estratégias para reduzir o risco de arco elétrico durante o teste de equipamentos energizados.

Corrigindo o problema, não a culpa

Swensen disse que o Facebook leva a questão do arco elétrico a sério e queria compartilhar suas descobertas com a indústria.

“Há questões muito importantes a serem feitas”, disse ele. “Se alguém se machuca porque não tomamos as medidas certas, o que isso nos custa como organização? Isso se encaixa perfeitamente no conceito do Facebook com a Open Compute – se compartilharmos isso, isso ajudará a indústria ”.

O 7×24 Exchange Fall é conhecido por sessões interativas de perguntas e respostas. Na apresentação do Facebook e Schneider Electric, um participante observou que os desafios na montagem e manutenção da duto de barras são bem compreendidos e perguntou se o Facebook tinha considerado projetos de energia alternativos.

“Fizemos mudanças fundamentais (no projeto dos duto de barras)”, desde os incidentes, disse Swensen, mas não ofereceu detalhes. Métodos alternativos incluem o uso de cabos, em vez de dutos, na distribuição de energia.

Bill Westbrock, da Schneider Electric, fala durante a conferência 7×24 Exchange Fall, em Phoenix

Bill Westbrock, da Schneider Electric, fala durante a conferência 7×24 Exchange Fall, em Phoenix. (Foto: Rich Miller)

A Schneider Electric e o Facebook disseram que a chave para revisões eficazes após incidentes é abordar o “jogo da culpa” na frente.

“Eu diria que muitas vezes o filtro que temos em mente é procurar ‘quem é o culpado'”, disse Swensen. “É aqui que, como usuários finais, é importante definir o tom e a cultura correta”.

“Muitas pessoas estão protegendo seus interesses”, disse Westbrock. “Nós dissemos ‘não vamos nos concentrar em avaliar a culpa, mas entender onde o colapso ocorreu. James disse que “não haverá culpa e nenhuma compensação financeira será solicitada”.

Isso nem sempre será fácil, especialmente em eventos envolvendo interrupções ou lesões, mas, Westbrock disse que a importância da questão não pede nada menos.

“Haverá problemas ao construirmos esses projetos”, disse Westbrock. “Estamos analisando problemas críticos. Nesta indústria, todos nós precisamos nos apropriar disso para garantir que façamos melhor ”.

 

Tags: , , ,

Adicione um comentário

Todos os campos são obrigatórios.