quarta-feira, 6 de outubro de 2021

AINDA SOBRE A PANE NO ZAP, FACE E INSTA

NÃO CONTORNE A DOR. SUPORTE-A. NÃO A NEGUE NEM QUEIRA PARECER FORTE. 

O WhatsApp, o Facebook e o Instagram voltaram ao ar, gradativamente, no início da noite da última segunda-feira, 4, após terem ficado inoperantes por cerca de seis horas. O "Zap" foi último a ter a função normalizada; Face e Insta retornaram por volta das 18h30, assim como o Messenger, que também apresentou anormalidades.

Houve pedidos de desculpas, muitos prejuízos e poucas explicações. Mark Zuckerberg, o CEO do Facebook (que controla o WhatsApp e o Instagram), perdeu US$ 5,9 bilhões de sua fortuna pessoal após uma queda de quase 5% no preço das ações de sua empresa na Nasdaq.

A causa da pane não foi imediatamente esclarecida. Tudo indica que o problema (e que problema!) decorreu de uma falha de DNS (detalhes nesta postagem). Para piorar, com a queda dos serviços, muitos usuários migraram para aplicativos como Telegram, que chegou a ficar instável por conta do pico de atividade.

O apagão também provocou reações em outras redes sociais, notadamente no Twitter, onde usuários reagiram com memes e piadas. Um levantamento feito pela consultoria Arquimedes a pedido da CNN deu conta de que pelo menos 2,5 milhões de brasileiros mencionaram o nome do WhatsApp, no Twitter, em menos de seis horas, repercutindo o tema. O Facebook foi citado por um milhão de pessoas, no Brasil, nesse mesmo período. 

Especulou-se que a falha — global — decorreu de um problema de comunicação entre o servidor de origem e o dispositivo de rede. Por volta das 13h (no horário do leste dos EUA) a ThousandEyes — divisão de análise de Internet da Cisco — postou no Twitter que a interrupção se devia a uma falha contínua de DNS.

De acordo com o DownDetector, que monitora sites e apps que não estão funcionando, 38% dos problemas mais notificados no WhatsApp tinham relação com o envio de mensagens, ao passo que os feeds do Instagram e do Facebook não carregavam. O WhatsApp afirmou que estava “investigando o motivo dessa instabilidade” e que iria “compartilhar novidades” assim que tiver completado a investigação. 

Facebook usou o Twitter para se posicionar sobre a situação logo que após a queda. “Estamos cientes de que algumas pessoas estão tendo problemas para acessar nossos aplicativos e produtos. Estamos trabalhando para que as coisas voltem ao normal o mais rápido possível e pedimos desculpas por qualquer inconveniente”, disse a empresa. Já o Instagram chegou a afirmar que "a rede social e seus amigos estão passando por um momento difícil”. “Tenham paciência conosco, estamos trabalhando nisso”, disse a empresa.

Ontem, o Face informou que “alterações de configuração nos roteadores de backbone que coordenam o tráfego de rede entre nossos data centers causaram problemas que interromperam a comunicação”. Dito com outras palavras, os sistemas deixaram de “conversar” com a Internet. Quando alguém tentava acessar o Zap, o Insta e o próprio Face, os aplicativos simplesmente não carregavam ou exibiam mensagens de erro como "DNS_PROBE_FINISHED_NXDOMAIN", que muita gente interpretou como um "erro de DNS", mas que, na verdade, era apenas um sintoma do apagão.

Zuckerberg explicou mais adiante que a origem do problema estava na comunicação entre os seus servidores. Ainda que as pessoas vissem o erro de DNS, era a conexão do Face com o mundo que estava interrompida. Mas descartou ataques hacker e assegurou que não houve vazamentos ou comprometimento dos dados dos usuários.

Os roteadores de backbone (espinha dorsal, numa tradução literal) foram o vilão da história. O Face tem milhares de roteadores espalhados pelo mundo, que ligam os servidores internos da empresa com a rede mundial de computadores. 

Segundo Thiago Ayub, diretor de tecnologia da Sage Networks, um erro de configuração nos roteadores teria feito com que os servidores não conseguissem se comunicar entre si nem com a Internet. Mas faltou explicar quem realizou a configuração errada que causou o apagão.

O DNS funciona como uma "lista telefônica" da Internet. É ele que registra os números (endereços IP) associados aos "nomes de domínio" (como "blogspot.com"). Essa "agenda" é responsável por converter em número IP o nome do site que os internautas digitam na barra de endereços do navegador. Quando acontece uma falha, o acesso à página fica indisponível porque não é possível encontrar o caminho que leva até ela. Numa analogia com a telefonia, é como se telefonássemos para o número do Facebook e ouvíssemos a mensagem de que esse número não existe. 

Para algumas usuários a mensagem era de "Erro 500" ou "Erro 5XX", que normalmente indicam uma dificuldade de comunicação do computador com o servidor que hospeda o site ou o aplicativo. Toda mensagem de erro que começa com 500 (de 500 a 599) indica um erro interno no servidor — ou seja, que o problema não está no navegador, no computador ou no smartphone do usuário, mas do outro lado da linha, ou melhor, do modem.

Até onde se sabe, a causa mais provável do problema foi uma configuração que retirou os sites da empresa da rota do BGP (de “Border Gateway Protocol”). Se os DNS é a agenda de contatos, o BGP é o sistema de navegação que decide qual rota a rede deve pegar para que a informação chegue corretamente. 

Sem as rotas BGP para a rede do Facebook, os servidores da empresa ficaram inacessíveis — incluindo os do WhatsApp e do Instagram. Sem falar que, com a pane, outros serviços — como Telegram, Nubank e Gmail — apresentaram instabilidade, já que o tráfego desses sites e aplicativos teve um pico de demanda. Ao jornal O Globo, o professor da Faculdade de Computação e Informática da Universidade Presbiteriana Mackenzie Vivaldo José Breternitz disse que era “como se não existisse mais o domínio Facebook na Internet”. 

Na tarde de segunda-feira o The New York Times informou que uma equipe de funcionários do Facebook havia sido enviada ao centro de dados da empresa, em Santa Clara, na Califórnia, para tentar uma “reinicialização manual” dos servidores. 

Sistemas que dependem do login do Facebook para funcionar também sentiram o impacto. Mas o impacto maior foi sentido por Zuckerberg, cuja fortuna pessoal, conforme mencionado linhas atrás, diminuiu cerca de US$ 6 bilhões (o patrimônio do empresário é de US$ 116,8 bilhões, segundo o ranking de bilionários em tempo real da revista Forbes). 

O CEO do Face caiu para a sexta posição no ranking das pessoas mais ricas do mundo. À frente dele estavam Jeff Bezos (Amazon), Bernard Arnault (LVMH), Bill Gates (Microsoft) e Larry Ellison (Oracle).  Mas o cenário mudou no dia de ontem, quando as ações do Face votaram a subir. Ao contrário das pequenas empresas tupiniquins que dependem do Zap para se comunicar com a distinta clientela, Zuckerberg já recuperou parte do prejuízo.