Publicado originalmente em: https://www.linkedin.com/pulse/o-que-%25C3%25A9-dia-768k-internet-sofrer%25C3%25A1-um-apag%25C3%25A3o-antonio-m-moreiras
Há gente dizendo por aí que a Internet falhará em algum momento agora em maio de 2019. Provavelmente, dirão alguns (*), num domingo à noite, bem na hora do lançamento de um novo episódio de Game of Thrones! Será o “dia 768k”! Vamos tentar entender isso…
Entendendo o que é a tabela de rotas da Internet.
A Internet é formada por 70000 redes diferentes aproximadamente, são diferentes empresas (provedores de acesso, provedores de conteúdo e serviços, universidades, empresas privadas, órgãos do governo, etc, no jargão da área as chamamos de Sistemas Autônomos). Cada uma gerencia seus próprios endereços IP. Esses são os endereços numéricos que identificam os dispositivos na rede global e que permitem o encaminhamento correto de cada pacote de dados da origem até o destino [1].
Cada uma dessas redes utiliza um protocolo chamado BGP. O BGP é o protocolo de roteamento da Internet. É basicamente um conjunto de regras de comunicação que especifica como uma rede conta à outra quais são seus endereços IP, e essa outra passa a informação pra frente, e assim sucessivamente, até que todas as 70 mil redes conheçam o caminho para chegar a cada um dos endereços da Internet… Elas montam, cada uma delas, um mapa de toda a Internet para si. Isso se chama tabela de rotas [2].
Vamos entender o que foi o “dia 512k”!
Em 12 de agosto de 2014 a tabela de rotas da Internet estava muito próxima a ter 512 mil rotas (informações de caminhos para diferentes redes de destino). Nessa data, houve um problema em uma das redes, ela por algum problema de configuração ou outro erro interno dividiu seus endereços em blocos menores e passou a mostrá-los com mais granularidade, ou seja, passou a anunciá-los para as outras redes de forma separada, dividida… Isso aumentou o número de caminhos, de rotas, na Internet em cerca de 15.000 (além das quase 512 mil que já estavam lá) num prazo de poucos minutos, o que fez algumas redes terem problemas! A Internet na época teve um ‘soluço’, como foi descrito por alguns artigos… Alguns usuários ficaram sem acesso à rede e alguns serviços inacessíveis. Esse evento foi apelidado de “dia 512k”.
O problema foi identificado como um limite em alguns roteadores (são os equipamento que executam o BGP, montam a tabela de rotas e a utilizam para encaminhar os pacotes). Em particular, alguns modelos de equipamentos da Cisco, os roteadores da linha Catalyst 6500 e 7600, e modelos específicos das linhas ASR 1000 e 9000, tinham um tamanho máximo para essa tabela, limitado por uma configuração padrão, para 512 mil entradas [3][4]. Pode ser que outros modelos de equipamentos, inclusive de outros fabricantes, tenham sido afetados também, ou potencialmente tenham alguma limitação relacionada. Mas o que está bem documentado foi o problema com esses modelos específicos da Cisco, que eram então mais utilizados.
O problema do limite de 512k traria consequências mesmo sem o tal erro de configuração que acrescentou 15000 rotas de uma vez à tabela, mas este acelerou o evento, e fez com que acontecesse de forma simultânea em muitas redes!
A solução adotada pelo pessoal técnico nessas redes foi alterar a configuração desses roteadores Cisco. Muitos configuraram um limite novo para 768k para resolver o problema temporariamente!
Afinal, então, o que é o “dia 768k”?
O burburinho que estamos ouvindo na imprensa e em alguns fóruns técnicos em relação ao “dia 768k” acontece porque agora estamos chegando a 768 mil linhas na tabela de rotas!
Isso é o “dia 768k”!
Será que o problema se repetirá? A Internet vai parar? Será que isso fará a Terra parar de girar e instalará o caos completo na humanidade, que voltará a uma época de barbárie?
Hoje os equipamentos da Cisco que sofreram o problema são considerados obsoletos, poucas redes os utilizam. Os equipamentos mais modernos não têm essa mesma limitação no tamanho da tabela de rotas. Contudo, as redes que os usam ainda precisam prestar bastante atenção agora para não terem problemas
Pode haver problemas? Dificilmente, mas sim. Se houver, provavelmente afetarão poucas redes. Algo menor do que ocorreu em 2014, que aliás também não foi tão grave… Como afirmei anteriormente, alguns artigos na época descreveram o ocorrido como apenas um ‘soluço’ na Internet. Esse problema mal tem sido levantado e discutido nos meios técnicos, porque de fato não é considerado sério.
Mas quando esse limite de 768k será atingido? Ou já foi atingido?
Uma excelente referência para acompanhar o crescimento da tabela é um site chamado CIDR Report, do Geoff Huston, que é o cientista chefe do APNIC, entidade que distribui endereços IP na região da Asia e Oceania [5].
Já ouvi dizer que essa medida do CIDR Report não é oficial. Não é mesmo. Nem essa nem nenhuma. Acontece que não existe isso de tabela de rotas ‘oficial’ na Internet. Cada uma das cerca de 70.000 redes na Internet vê a sua tabela de rotas, uma difere ligeiramente da outra, porque cada rede está conectada de forma diferente às demais!
Por exemplo, na empresa em que trabalho atualmente estamos conectados a diferentes provedores, vemos 769 mil, 764 mil e 744 mil rotas, valores diferentes em cada um deles. O CIDR Report mostra 777 mil entradas na tabela (rotas).
Algo interessante para se considerar é o seguinte: esse k, nos “768k”, se refere à base binária: do mesmo modo que 16 MB de memória é equivalente a 16*1024*1024 = 16.777.216 de bytes, 768k é 768*1024 = 786.432 entradas na tabela. Isso significa que ainda não atingimos o limite, mas estamos muito próximos dele…
O que fazer?
Apesar do risco agora para o “dia 768k” ser baixo, não custa praticamente nada e é aconselhável que cada operador de rede verifique se o seu equipamento tem alguma limitação que poderá trazer problemas, conferindo as especificações técnicas e configurações do mesmo.
Se houver limitações, não necessariamente o equipamento precisa ser trocado imediatamente. O operador pode criar filtros e não receber todas as informações de rotas… Assim, o roteador fica sem conhecer alguns caminhos específicos para alguns endereços na Internet, mas então pode-se escolher e configurar uma das redes diretamente conectadas para enviar a ela todos esses pacotes com endereços de destino desconhecidos. Ela por sua vez se encarregará de enviá-los para o lugar correto… Isso se chama rota default e é uma configuração comum, simples e bastante utilizada. Outra alternativa é trocar o equipamento por um sem essa limitação.
Então, estamos salvos e seguros?
Vale dizer que a Internet, incluindo sua infraestrutura de roteamento, é fortemente baseada em colaboração. Os equipamentos em si (roteadores usando BGP) confiam inerentemente uns nos outros. Configurações mal feitas, intencionalmente ou não, levam a problemas… Pequenos (e as vezes grandes) problemas ocorrem diariamente e há hoje diversas iniciativas globais para melhorar a estabilidade e segurança nessa infraestrutura! Ela não é ruim, mas pode ser bastante melhorada com a conscientização dos profissionais que trabalham nessas 70 mil redes diferentes.
Ou seja, o “dia 768k” de fato não é um problema, não esperamos nem apagões, muito menos o caos global! Contudo, a infraestrutura de roteamento da Internet é, de fato, suscetível a outros problemas e certamente passível de melhora.
Uma das campanhas, de abrangência internacional, é chamada MANRS (Mutually Agreed Norms for Routing Security). Essa campanha incentiva a adoção de algumas práticas e procedimentos simples na operação das redes. Práticas de baixo custo, mas que podem ter um imenso, enorme, impacto positivo na estabilidade e segurança da Internet. É coordenada e promovida por uma organização chamada Internet Society. A Internet Society é uma organização importantíssima para a Internet, uma espécie de associação de usuários que defende certos princípios para o desenvolvimento da rede, por exemplo, que a Internet deve ser uma só e para todos, ela atua em diversas áreas [6]…
Aqui no Brasil temos uma campanha chamada Programa Internet + Segura, promovida pelo NIC.br e pelo CGI.br, com parceria da Internet Society, e apoio das principais associações de provedores de Internet e empresas de Telecomunicações, como a Abranet, Abrint e Sinditelebrasil. Essa campanha apoia o MANRS e também trabalha com recomendações adicionais, além de envolver coordenação de ações com provedores, palestras, cursos e outras atividades [7].
Referências:
[1] Se quiser entender melhor o que são IPs, veja o vídeo: https://youtu.be/HNQD0qJ0TC4
[2] Se quiser entender melhor o que é BGP, tabela de rotas, e o que são Sistema Autônomos, veja o vídeo: https://youtu.be/C5qNAT_j63M
[3] https://blogs.cisco.com/sp/global-internet-routing-table-reaches-512k-milestone
[5] CIDR report: https://www.cidr-report.org
(*) os créditos da piada (sim! era uma piada…) são de https://www.linkedin.com/in/ctassisf/, que não obstante à referência, não é fã de Game of Thrones…