Os diversos motivos que justificam a engenharia de tráfego
A engenharia de tráfego é uma responsabilidade crucial para todo engenheiro e operador de rede, pois desempenha um papel fundamental na manutenção de um desempenho eficiente e confiável da rede. Embora a frequência dessa tarefa possa variar com base na empresa ou na função específica, ela continua sendo uma atividade comum e essencial devido às condições em constante evolução dentro de nossas redes e na Internet.
Um dos principais objetivos da engenharia de tráfego é melhorar o desempenho. Os engenheiros de rede se esforçam constantemente para otimizar o roteamento, garantindo que o tráfego percorra os caminhos mais eficientes. Essa busca incessante por desempenho não é apenas uma questão técnica, mas um compromisso com a melhoria da experiência do cliente, independentemente do setor.
No entanto, às vezes, a engenharia de tráfego é impulsionada por fatores não relacionados ao desempenho. Por exemplo, uma equipe de emparelhamento pode solicitar mudanças para cumprir obrigações contratuais ou para direcionar o tráfego a um caminho de rede mais acessível usando provedores de trânsito alternativos.
Independentemente da experiência, a tarefa em questão é desafiadora. Existem muitos desafios operacionais que os operadores de rede precisam considerar. Vários cenários operacionais ou relacionados à arquitetura podem prejudicar os resultados de suas tentativas de engenharia de tráfego. Alterações nas topologias, mudanças inesperadas na configuração e cenários isolados são algumas das situações que podem surgir. Afinal, muitas interrupções significativas ocorreram devido a falhas na engenharia de tráfego.
Apesar de nossa experiência com o algoritmo de seleção de melhor caminho de BGP, incluindo seu processo de tomada de decisão e nossa vasta experiência em preparação de AS_PATH, comunidades BGP e preferências locais, eventos inesperados ainda podem acontecer. Alterações fora do nosso controle administrativo ou dentro do nosso ambiente podem interromper inesperadamente os esforços de engenharia de tráfego.
Quando tais eventos ocorrem, aprendemos lições valiosas por meio de processos como análise de causa do problema e respondendo aos "5W." Frequentemente, essas lições levam a atualizações em nossos documentos de Método de Procedimento (MOP) para incluir etapas adicionais de verificação.
Devido à complexidade da engenharia de tráfego, engenheiros e operadores de rede precisam abordá-la com cautela. Isso envolve uma verificação minuciosa das tabelas de roteamento e encaminhamento, além do monitoramento contínuo de métricas críticas por meio de painéis e do uso de ferramentas de terceiros para validação.
Como alcançar a excelência operacional com a engenharia de tráfego BGP
No ThousandEyes, temos orgulho de oferecer sinais de alta qualidade para os profissionais de rede. Nossos recursos de monitoramento BGP e alerta quase em tempo real auxiliam nas operações, permitindo que os engenheiros validem as alterações na engenharia de tráfego de forma rápida. Disponibilizamos recursos completos de monitoramento para tráfego de entrada e saída, que oferecem insights do plano de controle BGP e do plano de dados, para que nenhum aspecto de sua rede fique sem supervisão.
No exemplo a seguir, vamos criar um teste para demonstrar como os profissionais de rede podem utilizar o ThousandEyes para verificar os efeitos de sua engenharia de tráfego BGP. Tudo isso é feito em uma única plataforma, eliminando a necessidade de procurar na Internet por ferramentas de monitoramento de rede que realmente funcionem e retornem resultados em um tempo razoável. Essa praticidade poupa seu tempo e esforço, permitindo que você se concentre no que realmente importa. Além disso, o ThousandEyes oferece feedback quase em tempo real tanto do plano de controle quanto do plano de dados—o mesmo plano de dados pelo qual o tráfego de clientes e produção é roteado.
Como mostrado na Figura 1 abaixo, os testes de agente para agente mostram a visualização bidirecional do caminho entre o agente "te-research-00" no AS 210312 e um agente implantado na nuvem da Oracle em Frankfurt, AS 31898. Os testes de agente para agente são fundamentais para visualizar os caminhos de encaminhamento e reversos. Considerando a natureza assimétrica da Internet, a visibilidade do caminho reverso faz uma diferença significativa e melhora a capacidade de realizar uma análise eficiente da causa do problema.

O tráfego TCP usado para testes do ThousandEyes é roteado pelo mesmo plano de dados que o tráfego de produção ou de clientes. Portanto, qualquer evento observado pelo ThousandEyes, como picos de latência ou perda de pacotes, provavelmente afetou também o tráfego de produção ou de clientes.
A visualização de roteamento BGP mostra a propagação de prefixo da perspectiva de centenas de monitores BGP implantados mundialmente, apresentando métricas como acessibilidade, alterações de caminho e atualizações.
Continuando com nosso exemplo, você pode observar que o ThousandEyes detectou proativamente que o agente "te-research-00" tem um endereço IP que faz parte do prefixo 193.5.19.0/24 e iniciou o monitoramento das métricas BGP relevantes, como mostrado na Figura 2.

Como visualizar a engenharia de tráfego de entrada
Seguindo nosso exemplo anterior, a equipe de operações de rede realizou engenharia de tráfego de entrada para impactar o tráfego que chega à rede. Existem várias maneiras de realizá-la, mas os métodos mais comumente usados envolvem a agregação/desagregação de prefixos, a preparação do AS_PATH e as comunidades BGP disponibilizadas pelos provedores de trânsito.
Como você pode ver na linha do tempo da Figura 3, no dia 24 de julho às 05:07 CST, nossa equipe de operações de rede realizou proativamente uma alteração de engenharia de tráfego no tráfego de entrada usando comunidades BGP. Nosso objetivo era remover o AS 25091 do caminho e conseguimos redirecionar o tráfego por meio do AS 34549. As retiradas aparecem como linhas vermelhas tracejadas, enquanto as linhas vermelhas sólidas representam o caminho que o tráfego seguiu após a engenharia de tráfego de entrada.

Na visualização “Alterações de caminho BGP”, o ThousandEyes permite que os usuários verifiquem os carimbos de hora detalhados ao navegar até um dos monitores BGP à esquerda e selecionar a opção “Ver detalhes das alterações de caminho”.

Como mostrado na Figura 4, às 05:07:19 CST, o Monitor BGP England-68 observou uma alteração de caminho que não incluía mais o AS 25091. Em vez disso, o caminho agora incluía o AS 34549.
Se navegarmos até a visualização “Agente para agente”, é possível observar que os endereços IP na direção reversa mudaram, mas o agrupamento com base na rede indica que o AS 25091 foi completamente removido do caminho, como mostrado nas Figuras 5 e 6.


Com o monitoramento BGP e alerta quase em tempo real, podemos verificar com confiança os efeitos de nossas alterações na engenharia de tráfego. O ThousandEyes nos permite fazer isso diretamente, tanto da perspectiva do plano de controle usando a Visualização de roteamento BGP quanto do plano de dados usando a Path Visualization (visualização do caminho).
Como visualizar a engenharia de tráfego de saída
O ThousandEyes sempre conseguiu demonstrar os impactos da engenharia de tráfego de saída. Uma estratégia frequentemente utilizada na engenharia de tráfego é o ajuste da preferência local. Diferente de outros atributos BGP, a preferência local não é transitiva, ou seja, não é compartilhada com outros pares e não pode ser vista em feeds eBGP. Portanto, precisamos contar com a visibilidade do nosso plano de dados e os insights em tais cenários.
Como mostrado na Figura 7 abaixo, ao navegar até a visualização “Agente para agente” e examinar a Path Visualization (visualização do caminho) às 07:34 CST no dia 24 de julho de 2024, podemos ver como o tráfego foi roteado no plano de dados, apenas um minuto antes de a equipe de operações de rede decidir alterar o caminho.

Examinar o caminho do plano de dados na linha do tempo é de extrema importância, pois fornece uma compreensão clara do fluxo de tráfego antes, durante e após qualquer alteração implementada, como mostrado na Figura 8.

Um minuto depois, às 07:35 CST, a equipe de operações de rede aplicou a engenharia de tráfego de saída, alterando significativamente o caminho. Como resultado, o tráfego foi roteado do AS de origem 210312 para o AS 8298 (trânsito) antes de chegar ao AS 31898 da Oracle, como mostrado nas Figuras 9 e 10.


Por que isso importa?
Todos nós buscamos alcançar a excelência operacional. No entanto, em ambientes cada vez mais complexos, atingir a excelência operacional pode parecer desafiador. Os riscos são altos. Resultados adversos da engenharia de tráfego frequentemente levam a interrupções e vazamentos de rota, resultando, muitas vezes, em perdas tanto de reputação quanto financeiras para as organizações.
Por muito tempo, a comunidade de engenharia de rede tem enfrentado dificuldades devido a ferramentas inadequadas. Essas ferramentas, como as de monitoramento de rede disponíveis na Internet, e soluções que utilizam dados do plano de controle, frequentemente geram insegurança quanto à eficácia da nossa engenharia de tráfego e à integridade das nossas redes.
O ThousandEyes preenche essa lacuna. Com monitoramento BGP e alerta quase em tempo real, oferecemos uma visibilidade sem precedentes sobre a propagação dos seus prefixos da perspectiva de centenas de monitores estrategicamente posicionados ao redor do mundo. Hoje, enquanto você analisa a tabela de roteamento, o ThousandEyes oferece visibilidade sobre os efeitos da sua engenharia de tráfego de diversos pontos de vista ao redor do mundo, quase instantaneamente. Você está analisando os efeitos de centenas de ferramentas de monitoramento de rede simultaneamente, que são mais confiáveis, rápidos e eficazes.
E não’t paramos por aí. Com a Path Visualization (visualização do caminho), não apenas apresentamos os efeitos da sua engenharia de tráfego de saída, como mostrado no exemplo acima, mas também fazemos isso da perspectiva do plano de dados. O mesmo plano de dados pelo qual o seu tráfego de produção e de clientes está sendo roteado. E, nesse caso, visualizamos os efeitos tanto na direção de encaminhamento quanto na direção reversa.
Quantas vezes você entrou em contato com seu parceiro de emparelhamento para executar um MTR no caminho reverso, apenas para descobrir que o problema estava lá? Quanto tempo isso leva? Todos nós já passamos por isso e, coletivamente, merecemos algo melhor.
Com nossas recentes melhorias no produto, que incluem monitoramento BGP e alerta quase em tempo real, além de todos os benefícios da Path Visualization (visualização do caminho) e da alta qualidade de sinal pela qual o ThousandEyes é reconhecido, finalmente conseguimos isso (e é muito melhor).