Las numerosas razones de la ingeniería de tráfico
Todo ingeniero y operador de redes es responsable de la ingeniería de tráfico, ya que esta cumple un papel crucial para mantener el rendimiento eficiente y confiable de la red. Aunque la frecuencia de esta tarea puede variar según la empresa o la función específica, sigue siendo una actividad común y esencial dadas las condiciones en evolución dentro de nuestras redes y a través de Internet.
Uno de los objetivos principales de la ingeniería de tráfico es mejorar el rendimiento. Los ingenieros de redes se esfuerzan constantemente por optimizar el routing para garantizar que el tráfico atraviese las rutas más eficientes. Esta búsqueda incesante de rendimiento no es solo un objetivo técnico, sino un compromiso para mejorar la experiencia del cliente, independientemente del sector.
En ocasiones, sin embargo, la ingeniería de tráfico se ve impulsada por factores independientes del rendimiento. Por ejemplo, un equipo de interconexión podría solicitar cambios para cumplir con obligaciones contractuales o para empujar el tráfico a una ruta de red más asequible mediante proveedores de tránsito alternativos.
Sea cual sea la experiencia, la tarea entre manos es todo un desafío. Existen numerosos desafíos operativos que los operadores de redes deben considerar. Muchas situaciones operativas o relacionadas con la arquitectura pueden afectar de forma negativa los resultados de sus intentos de ingeniería de tráfico. Pensemos en cambios de topología, situaciones únicas y cambios de configuración inesperados. Al fin y al cabo, muchas interrupciones de suministro importantes se debieron a errores de ingeniería de tráfico.
A pesar de nuestros conocimientos sobre el Algoritmo de selección de la mejor ruta BGP, su proceso de toma de decisiones, y nuestra amplia experiencia con AS_PATH prepending, las comunidades BGP y las manipulaciones de preferencia local, los eventos inesperados ocurren. Los cambios fuera de nuestro control administrativo o dentro de nuestro entorno pueden interrumpir de manera inesperada los esfuerzos de ingeniería de tráfico.
Cuando se producen estos acontecimientos, aprendemos una lección valiosa a través de procesos como el análisis del origen del problema y respondiendo a los "5 porqués." A menudo, estas lecciones generan actualizaciones en nuestros documentos sobre el Método de procedimiento (MOP) para incluir pasos de verificación adicionales.
Dada la naturaleza compleja de la ingeniería de tráfico, los ingenieros y operadores de redes deben abordarla con cautela. Esto implica verificación exhaustiva de las tablas de routing y reenvío, monitoreo continuo de métricas críticas a través de tableros y uso de herramientas de terceros para la validación.
Excelencia operativa optimizada con la ingeniería de tráfico de BGP
En ThousandEyes nos enorgullecemos de ofrecer señales de alta calidad a los profesionales de redes. Nuestras capacidades de alerta y monitoreo BGP en tiempo casi real contribuyen a las operaciones y permiten que los ingenieros validen los cambios de la ingeniería del tráfico sin demora. Ofrecemos capacidades de monitoreo integrales del tráfico de entrada y salida, al proporcionar información tanto desde la perspectiva del plano de control como del plano de datos de BGP, para garantizar que ningún aspecto de su red quede sin monitorear.
En el siguiente ejemplo, crearemos una prueba para demostrar cómo los profesionales de redes pueden utilizar ThousandEyes para verificar los efectos de su ingeniería de tráfico de BGP. Todo esto se realiza dentro de una única plataforma, lo que elimina la necesidad de buscar en Internet "visores" que realmente funcionen y devuelvan resultados en un tiempo razonable. Esta practicidad le ahorra tiempo y esfuerzo, y le permite centrarse en lo importante. Además de eso, ThousandEyes no solo proporciona comentarios casi en tiempo real desde el plano de control, sino también desde el plano de datos: el mismo por el que se enrutan su tráfico de producción y de clientes.
Como se muestra en la Figura 1 a continuación, las pruebas de agente a agente muestran la visualización de rutas bidireccionales entre el agente "te-research-00" en AS 210312 y un agente implementado en la nube de Oracle en Frankfurt, AS 31898. Las pruebas de agente a agente son muy valiosas para visualizar tanto las rutas de reenvío como las inversas. Dada la naturaleza asimétrica de Internet, la visibilidad de la ruta inversa constituye una diferencia significativa y mejora la capacidad de llevar a cabo un análisis eficaz del origen del problema.

El tráfico de TCP que se utiliza para las pruebas de ThousandEyes se enruta por el mismo plano de datos que su tráfico de producción o de clientes. Por lo tanto, es probable que cualquier evento observado por ThousandEyes, como picos de latencia o pérdida del paquete, también haya afectado su tráfico de producción o de clientes.
La visualización de rutas BGP muestra la propagación de prefijos desde la perspectiva de cientos de monitores de BGP implementados en todo el mundo. La visualización de rutas BGP muestra métricas como accesibilidad, cambios de ruta y actualizaciones.
Continuando con nuestro ejemplo, puede ver que ThousandEyes detectó de manera proactiva que el agente "te-research-00" tiene una dirección IP que forma parte del prefijo 193.5.19.0/24 e inició el monitoreo de las métricas BGP relevantes, como se muestra en la Figura 2.

Visualización de la ingeniería de tráfico de entrada
Siguiendo nuestro ejemplo anterior, el equipo de operaciones de red realizó ingeniería de tráfico en la entrada para afectar al tráfico que ingresaba a la red. Existen varias formas de llevarlo a cabo, pero los métodos más utilizados implican la agregación/desagregación de prefijos, AS_PATH prepending y las comunidades BGP proporcionadas por proveedores de tránsito.
Como se puede ver en la línea de tiempo de la Figura 3, el 24 de julio a las 05:07 CST, nuestro equipo de operaciones de red realizó de manera proactiva un cambio de ingeniería de tráfico en el tráfico de entrada a través de comunidades BGP. Nuestro objetivo era eliminar AS 25091 de la ruta, y conseguimos con éxito volver a enrutar el tráfico a través de AS 34549. Los retiros se visualizan mediante líneas rojas punteadas, mientras que las líneas rojas continuas representan la ruta que siguió el tráfico tras la ingeniería de tráfico de entrada.

Mientras se está en la vista "Cambios de rutas BGP", ThousandEyes permite a los usuarios revisar las marcas de hora detalladas. Para esto, deben navegar a uno de los monitores BGP de la parte izquierda y seleccionar la opción "Ver detalles de los cambios de rutas".

Como se muestra en la Figura 4, a las 05:07:19 CST, el monitor de BGP England-68 observó un cambio de ruta que ya no incluía AS 25091. En su lugar, la ruta ahora incluía AS 34549.
Si vamos a la vista "Agente a agente", podemos ver que las direcciones IP en la dirección inversa cambiaron, pero la agrupación basada en la red indica que AS 25091 se eliminó por completo de la ruta, como se muestra en las Figuras 5 y 6.


Con alertas y monitoreo de BGP casi en tiempo real, podemos verificar con confianza los efectos de nuestros cambios de ingeniería de tráfico. ThousandEyes nos permite hacerlo directamente, tanto desde la perspectiva del plano de control mediante la visualización de rutas BGP como desde el plano de datos mediante Path Visualization.
Visualización de la ingeniería de tráfico de salida
ThousandEyes siempre tuvo la capacidad de demostrar los impactos de la ingeniería de tráfico de salida. Una estrategia muy utilizada en ingeniería de tráfico consiste en ajustar la preferencia local. A diferencia de otros atributos BGP, la preferencia local no es transitiva, lo que significa que no se comparte con otros pares y no puede verse en las alimentaciones eBGP. Como consecuencia, debemos depender de la visibilidad y la información de nuestro plano de datos en tales situaciones.
Como se muestra en la Figura 7 a continuación, al navegar hacia al vista "Agente a agente" y examinar Path Visualization a las 07:34 CST del 24 de julio de 2024, podemos ver cómo estaba enrutado el tráfico en el plano de datos, justo un minuto antes de que el equipo de operaciones de red decidiera alterar la ruta.

Examinar la ruta del plano de datos en la línea de tiempo es de suma importancia, ya que proporciona una comprensión clara del flujo de tráfico antes, durante y después de la implementación de cualquier cambio, como se muestra en la Figura 8.

Un minuto después, a las 07:35 CST, el equipo de operaciones de red aplicó ingeniería de tráfico de salida y cambió significativamente la ruta. Como resultado, el tráfico se enrutó desde AS 210312 de origen hacia AS 8298 (tránsito) antes de llegar a AS 31898 de Oracle, como se muestra en las Figuras 9 y 10.


¿Por qué es importante?
Todos aspiramos a alcanzar la excelencia operativa. Sin embargo, en entornos cada vez más complejos, alcanzar la excelencia operativa puede resultar abrumador. Los riesgos son altos. Los resultados adversos de la ingeniería de tráfico suelen provocar interrupciones de suministro y filtraciones de rutas y, en la mayoría de los casos, suponen pérdidas tanto de reputación como económicas para las organizaciones.
Durante demasiado tiempo, la comunidad de ingeniería de red se ha visto sobrecargada por su dependencia en herramientas deficientes. Estas herramientas, como los "visores", diseminadas por Internet y las soluciones que usan datos del plano de control, nos han dejado, a menudo, una sensación de incertidumbre sobre la eficacia de nuestra ingeniería de tráfico y el estado de nuestras redes.
ThousandEyes cierra esta brecha. Con alertas y monitoreo de BGP casi en tiempo real, le brindamos visibilidad sin precedentes en lo que respecta a la propagación de sus prefijos desde la perspectiva de cientos de monitores implementados estratégicamente en todo el mundo. Hoy en día, mientras controla lo que sucede desde la perspectiva de la tabla de routing, ThousandEyes proporciona visibilidad sobre los efectos de su ingeniería de tráfico desde varios puntos de visibilidad en todo el mundo, casi de forma instantánea. Comprobará los efectos desde cientos de visores a la vez, solo que más confiables, rápidos y atractivos.
Y eso no es todo. Con Path Visualization, no solo le mostramos los efectos de su ingeniería de tráfico de salida, como se ve en el ejemplo anterior, sino que lo hacemos desde la perspectiva del plano de datos. El mismo plano de datos por el que se enruta su tráfico de producción y de clientes. Y, en este caso, visualizamos los efectos tanto en la dirección de reenvío como inversa.
¿Cuántas veces ha llamado a su partner de interconexión para ejecutar MTR en la ruta inversa, solo para descubrir que el problema está ahí? ¿Cuánto tiempo se tarda? Todos hemos pasado por ello, y colectivamente, nos merecemos algo mejor.
Con nuestras recientes mejoras de producto, que incluyen alertas y monitoreo de BGP casi en tiempo real, junto con todas las ventajas de Path Visualization y la señal de alta calidad por la que ThousandEyes es reconocida, por fin lo hemos logrado (y es mucho mejor).