Atualização de DNS afeta Facebook e diversos outros serviços na Internet

Atualização de DNS afeta Facebook e diversos outros serviços na Internet. Sistemas do Facebook disse ao BGP, por meio de uma série de atualizações, que os caminhos para o Facebook não existiam mais.

O Facebook se desculpou na noite de segunda-feira por uma indisponibilidade massiva que interrompeu o serviço para as plataformas do gigante da mídia social para usuários em todo o mundo, e disse que a interrupção foi devido a uma “mudança de configuração defeituosa”.

A empresa disse que nenhum dado do usuário foi comprometido no apagão, que deixou o Facebook, Instagram e WhatsApp fora do ar por mais de seis horas.

Todas as três plataformas, pertencentes e operadas pela Facebook Inc., com sede em Menlo Park, Califórnia, saíram de serviço por volta das 11:40h horário do Brasil e por volta das 18h00, os usuários de todas as três plataformas relataram que alguns serviços foram restaurados, mas a funcionalidade total permaneceu indefinida até a noite de segunda-feira.

Ao longo da tarde Por meio de sua conta oficial no Twitter, o Facebook — que também é dono do WhatsApp e Instagram— confirmou o problema no mundo todo, mas não deu detalhes sobre a falha “Estamos cientes de que algumas pessoas estão tendo problemas para acessar nossos aplicativos e produtos. Estamos trabalhando para voltar ao normal o mais rápido possível e pedimos desculpas por qualquer inconveniente

Segundo a NBC News, a noite a empresa em um comunicado na  disse que “Nossas equipes de engenharia descobriram que as alterações de configuração nos roteadores de backbone que coordenam o tráfego de rede entre nossos data centers causaram problemas que interromperam essa comunicação“. “Essa interrupção do tráfego de rede teve um efeito cascata na maneira como nossos data centers se comunicam, interrompendo nossos serviços.

O CEO Mark Zuckerberg, em um post no Facebook às 18:54h, também se desculpou. “Desculpe pela interrupção de hoje – eu sei o quanto você confia em nossos serviços para ficar conectado com as pessoas de quem gosta.

Um funcionário do Facebook disse que parecia ser um problema com o DNS , que os computadores usam para pesquisar sites individuais. “Eu gostaria de saber. Sem ferramentas internas, o DNS parece totalmente sobrecarregado. Todo mundo está meio parado“, disse a fonte da NBC News. “Não há razão neste momento para suspeitar de algo malicioso, mas a interrupção está afetando quase tudo. Não consigo nem acessar ferramentas de terceiros.

Em seu comunicado o Facebook confirmou que a causa da interrupção foi uma mudança de configuração nos roteadores de backbone que coordenam o tráfego de rede entre os data centers da empresa, que teve um efeito cascata, interrompendo todos os serviços do Facebook. Isso significava que não apenas o Facebook havia desaparecido, mas tudo o que o Facebook administrava também havia desaparecido.

O The Guardian relata que outros forneceram mais detalhes sobre por que o Facebook desapareceu da Internet. A Cloudflare – que teve seus próprios problemas recentes de interrupção da Internet – forneceu uma explicação detalhada sobre o que aconteceu.

Envolve duas coisas que definem como a Internet é a Internet – ou seja, Domain Name System (DNS) e Border Gateway Protocol (BGP).

A internet é um monte de redes conectadas. Então, isso significa manter a ordem das coisas, você precisa de algo como o BGP para dizer onde você precisa ir. O DNS é essencialmente o sistema de endereço para a localização de cada site da Web – seu endereço IP – enquanto o BGP é o roteiro que encontra a maneira mais eficiente de chegar a esse endereço IP.

Cloudflare disse que o Facebook ontem, 04/10, essencialmente disse ao BGP, por meio de uma série de atualizações, que os caminhos para o Facebook não existiam mais. Mas não apenas para o Facebook, tudo o que o Facebook executa. Isso significava que as pessoas que tentavam acessar o Facebook não conseguiam encontrar o caminho para acessá-lo.

E um funcionário do WhatsApp disse à NBC News, que nenhum serviço interno na sede da empresa funcionava, exceto e-mail e calendários. Mesmo as salas de conferência ficaram inacessíveis durante a interrupção, disse o funcionário, porque elas estão digitalmente bloqueadas e desbloqueadas por meio de um tablet conectado à Internet.

A interrupção ocorreu um dia depois de o Facebook ter enfrentado acusações de um denunciante de que fez vista grossa para a desinformação que levou ao tumulto mortal de 6 de janeiro no Capitólio dos Estados Unidos. “O Facebook, repetidas vezes, mostrou que prefere o lucro à segurança”, disse a ex-cientista de dados do Facebook Frances Haugen no programa “60 Minutes” da CBS, em um episódio que foi ao ar na noite de domingo, 03/10.

Ela deve testemunhar perante uma subcomissão do Senado na terça-feira.

Uma porta-voz do Facebook, respondendo ao relatório “60 Minutes”, disse que a empresa fez “melhorias significativas para combater a disseminação de desinformação e conteúdo prejudicial“.

Por que o Instagram, o Messenger e o WhatsApp ficaram fora do ar?

Todos os serviços do Facebook foram afetados, não apenas o Facebook. Incluía os próprios sistemas internos do Facebook, com relatórios de que a equipe ficava sem acesso aos escritórios e não conseguia acessar sua própria plataforma de comunicação interna.

Segundo o site Downdetector, que monitora a disponibilidade de serviços na Internet, não somente os serviços do Facebook, Instagram, Messenger e Whatsapp foram afetados, na realidade vários outros serviços que de alguma forma confiam a autenticação ou qualquer outro meio de interação à plataforma do Facebook , foram afetados, em um verdadeiro efeito “cascata“. Sheera Frenkel, repórter de tecnologia do New York Times, disse ao programa Today que parte do motivo da demora para consertar era porque “as pessoas que tentavam descobrir qual era o problema não conseguiam nem mesmo entrar fisicamente no prédio” para trabalhar descobrir o que deu errado.

Downdetector, que rastreia interrupções, disse cerca de 10,6 milhões de relatórios de problemas em todo o mundo. No entanto, o número real de pessoas afetadas é muito maior: mais de 3,5 bilhões de pessoas usam Facebook, Messenger, Instagram e Whatsapp.

Muitos se viram separados da família e dos amigos com quem interagem nos vários serviços, enquanto as pequenas empresas que usam as mídias sociais para se conectar com os clientes se depararam com a perspectiva de um golpe financeiro inesperado.

No gráfico abaixo podemos observar que a partir do momento que o Facebook parou todas as demais plataformas monitoradas também apresentaram problemas de indisponibilidades (parciais ou não)

Por que demorou tanto para consertar?

Os próprios sistemas internos do Facebook são executados no mesmo local, por isso era difícil para os funcionários diagnosticar e resolver o problema.

Como o editor de tecnologia do Guardian no Reino Unido, Alex Hern, colocou no Twitter: “O Facebook executa TUDO através do Facebook”, então a maneira usual de corrigir um problema como esse também não estava funcionando.

A equipe do Facebook não conseguiu acessar sua própria plataforma de comunicação, Workplace, e também não conseguiu acessar seu escritório devido ao sistema de passes de segurança estar preso na interrupção.

O Facebook indicou que a duração e a gravidade da interrupção significava que os sistemas estavam sendo restaurados à capacidade total lentamente.

Como eles consertaram isso?

O Facebook até agora não deu muitos detalhes sobre o que deu errado e como foi consertado, mas houve vários relatos de que a gigante das mídias sociais enviou uma equipe técnica para seus servidores na Califórnia para redefinir manualmente os servidores de origem do problema.

Esse tipo de interrupção pode ser evitado no futuro?

Este é bastante incomum, mas não algo que pode ser completamente evitado. No entanto, a interrupção do Facebook, junto com outras, incluindo a interrupção do Cloudflare em 2020 e a do Fastly em junho , mostram os problemas de ter um único ponto de falha para um grande número de serviços online dos quais as pessoas confiam.

As pessoas confiam no Facebook não apenas para se conectar com amigos e familiares, mas também as empresas o usam para entrar em outros serviços, incluindo sites de vendas online. Em alguns países, é o meio de comunicação dominante por meio de serviços como o WhatsApp. O fato de uma paralisação ter um impacto tão profundo em bilhões de pessoas por várias horas fará com que pare para pensar.