Sector

Aprovechamiento de la monitorización BGP en tiempo real para la ingeniería del tráfico

Por Kemal Sanjta
| | 17 minutos de lectura

Esta publicación también está disponible para: United States (English), Germany (Deutsch), Mexico (Español), France (Français), Italy (Italiano), Japan (日本語), Korea (한국어), Brazil (Português) & Mainland China (简体中文).

Resumen

La ingeniería del tráfico juega un papel esencial a la hora de optimizar el rendimiento de la red. ThousandEyes mejora este proceso con soluciones de alerta y monitorización BGP en tiempo casi real, visualización de rutas de tráfico, detección de problemas y aportación de insights, tanto desde el plano de datos como desde el control BGP para garantizar la excelencia operativa.


La gran cantidad de motivos que están detrás de la ingeniería del tráfico

La ingeniería del tráfico es una responsabilidad esencial de todos los operadores e ingenieros de red, ya que juega un papel vital a la hora de hacer que el rendimiento de la red sea fiable y eficaz. Aunque la frecuencia de esta tarea puede variar en función de la empresa o del puesto específico, es una actividad habitual y esencial debido a las condiciones de constante evolución de las redes e Internet.

Uno de los objetivos principales de la ingeniería del tráfico es mejorar el rendimiento. Los ingenieros de red buscan constantemente la optimización del enrutamiento para asegurarse de que el tráfico toma las rutas más eficientes. Esta incansable búsqueda del rendimiento no es solo un esfuerzo técnico, sino un compromiso con la mejora de la experiencia del cliente, sea el sector que sea.

Sin embargo, a veces, la ingeniería del tráfico se lleva a cabo por factores no relacionados con el rendimiento. Por ejemplo, un equipo de interconexión puede pedir cambios para cumplir con obligaciones contractuales o que se envíe el tráfico a una ruta de red más asequible con proveedores de tráfico alternativos.

Sea cual sea la experiencia, la tarea presenta sus retos. Hay muchos desafíos operativos que tienen que tener en cuenta los operadores de red. Hay muchos escenarios operativos o arquitectónicos distintos que pueden afectar de forma negativa al resultado de los intentos de ingeniería del tráfico. Los cambios en la topología, los escenarios singulares y los cambios de configuración inesperados son solo algunos de los que se me ocurren. Después de todo, muchas caídas significativas se han producido por errores en la ingeniería del tráfico.

Se producen acontecimientos inesperados a pesar de nuestra experiencia con el algoritmo de selección de la mejor ruta BGP, su proceso de toma de decisiones y una amplia experiencia con la anteposición de AS_PATH, las comunidades BGP y las manipulaciones de prefijos locales. Los cambios que quedan fuera de nuestro control administrativo o que se llevan a cabo en nuestro entorno pueden dificultar los esfuerzos de la ingeniería del tráfico.

Cuando se producen estos acontecimientos, aprendemos una lección valiosa a través de procesos como el análisis del origen del problema y respondiendo a los "5 porqués." Con frecuencia, estas lecciones dan como fruto actualizaciones en nuestros documentos de Método de procedimiento para incluir pasos de verificación adicionales. 

Dada la naturaleza intrincada de la ingeniería del tráfico, los operadores y los ingenieros de red deben abordarla con precaución. Esto incluye una verificación exhaustiva de las tablas de enrutamiento y reenvío, la monitorización continua de las métricas esenciales a través de paneles y el uso de herramientas de terceros para la validación.

Conseguir la excelencia operativa con la ingeniería del tráfico BGP

En ThousandEyes nos enorgullece proporcionar señales de alta calidad a los profesionales de la red. Nuestras capacidades de alerta y monitorización BGP en tiempo casi real contribuyen a las operaciones y permiten que los ingenieros validen los cambios de la ingeniería del tráfico sin demora. Aportamos funciones de monitorización completa del tráfico de entrada y salida, lo que ofrece insights desde el plano de control BGP y desde el plano de datos para garantizar que no queda ningún aspecto de la red sin monitorizar.

En el siguiente ejemplo, crearemos un test para mostrar cómo pueden utilizar ThousandEyes los profesionales de la red para verificar los efectos de su ingeniería del tráfico BGP. Todo se hace desde una única plataforma, con lo que se elimina la necesidad de buscar plataformas de visualización en Internet que funcionen de verdad y que generen resultados en un tiempo razonable. Esta función práctica ahorra tiempo y dinero y permite centrarse en lo realmente importante. Además, ThousandEyes no solo proporciona información en tiempo casi real desde el plano de control, sino también desde el plano de los datos, que es el mismo por el que pasa el tráfico de producción y el del cliente.

Como se muestra en la figura 1 que aparece a continuación, los tests de agente a agente muestran la visualización de la ruta bidireccional entre el agente "te-research-00" en AS 210312 y un agente desplegado en la nube de Oracle en Frankfurt, AS 31898. Los tests de agente a agente son una herramienta de valor incalculable para visualizar las rutas de reenvío e inversas. Dada la naturaleza asimétrica de Internet, la visibilidad de la ruta inversa constituye una diferencia significativa y mejora la capacidad de llevar a cabo un análisis eficaz del origen del problema.

Los tests de agente a agente permiten visualizar las rutas de reenvío e inversas
Figura 1. Los tests de agente a agente permiten visualizar las rutas de reenvío e inversas

El tráfico de TCP que se usa para los tests de ThousandEyes se canaliza por el mismo plano de datos que el tráfico de producción o del cliente. Por lo tanto, cualquier acontecimiento visto en ThousandEyes, como picos de latencia o pérdida de paquetes, es muy posible que afecte también al tráfico de producción o del cliente.

La visualización de la ruta BGP muestra la propagación del prefijo desde la perspectiva de cientos de monitores de BGP instalados en todo el mundo. La visualización de la ruta BGP muestra métricas como la accesibilidad, los cambios en la ruta y las actualizaciones.

Si seguimos con nuestro ejemplo, se puede ver que ThousandEyes ha detectado de forma proactiva que el agente "te-research-00" tiene una dirección IP que forma parte del prefijo 193.5.19.0/24 y ha iniciado la monitorización de las métricas de BGP relevantes, como se muestra en la figura 2.

La visualización de la ruta BGP muestra la propagación del prefijo desde la perspectiva de cientos de monitores de BGP instalados estratégicamente
Figura 2. La visualización de la ruta BGP muestra la propagación del prefijo desde la perspectiva de cientos de monitores de BGP instalados estratégicamente

Visualización de la ingeniería del tráfico de entrada 

Si seguimos con nuestro ejemplo anterior, el equipo de operaciones de red ha llevado a cabo ingeniería del tráfico en la entrada para afectar al tráfico que entra en la red. Hay muchas formas de hacer esto, pero los métodos usados más habitualmente implican la agregación/desagregación, la anteposición de AS_PATH y las comunidades BGP que proporcionan los proveedores de tráfico.

Como puede ver en la línea temporal de la figura 3, el 24 de julio a las 05:07 CST, nuestro equipo de operaciones de red llevó a cabo de forma proactiva un cambio en la ingeniería del tráfico de entrada con las comunidades de BGP. Nuestro objetivo consistía en eliminar a AS 25091 de la ruta y conseguimos un nuevo routing de tráfico a través de AS 34549. Las retiradas se visualizan con líneas rojas rayadas, mientras que las líneas de rojo sólido representan la ruta que tomó el tráfico después de la ingeniería del tráfico de entrada.

La visualización de la ruta BGP muestra la ingeniería del tráfico de entrada
Figura 3. La visualización de la ruta BGP muestra la ingeniería del tráfico de entrada

Desde la vista de cambios de la ruta BGP, ThousandEyes permite que los usuarios puedan comprobar marcas temporales detalladas accediendo a uno de los monitores BGP del lado izquierdo y seleccionando la opción de visualización de los detalles de los cambios en la ruta.

Visualización de los detalles de los cambios en la ruta
Figura 4. Visualización de los detalles de los cambios en la ruta

Como se muestra en la figura 4, a las 05:07:19 CST, el monitor BGP England-68 observó un cambio en la ruta que ya no incluía a AS 25091. En su lugar, la ruta ahora incluía a AS 34549.

Si pasamos a la vista de agente a agente, podemos ver que las direcciones IP cambiaron en la dirección inversa, pero el agrupamiento basado en la red indica que AS 25091 se eliminó por completo de la ruta, como se puede ver en las figuras 5 y 6.

Path Visualization muestra a AS 25091 en la ruta antes del cambio de ingeniería del tráfico
Figura 5. Path Visualization muestra a AS 25091 en la ruta antes del cambio de ingeniería del tráfico

Path Visualization muestra que se ha eliminado por completo a AS 25091 de la ruta después del cambio de ingeniería del tráficoPath Visualization muestra que se ha eliminado por completo a AS 25091 de la ruta después del cambio de ingeniería del tráfico
Figura 6.
Path Visualization muestra que se ha eliminado por completo a AS 25091 de la ruta después del cambio de ingeniería del tráfico

Con alertas y monitorización BGP en tiempo casi real, podemos verificar los efectos de nuestros cambios de ingeniería del tráfico con confianza. ThousandEyes nos permite hacerlo directamente, tanto desde el plano de control mediante BGP Route Visualization como desde el plano de datos con Path Visualization. 

Visualización de la ingeniería del tráfico de salida

ThousandEyes siempre ha tenido la capacidad de mostrar el impacto de la ingeniería del tráfico de salida. Una estrategia que se utiliza con frecuencia en la ingeniería del tráfico es ajustar la preferencia local. A diferencia de otros atributos de BGP, la preferencia local no es transitiva, es decir, no se comparte con otros pares y no se puede ver en las fuentes de eBGP. Como resultado, en tales casos dependemos de nuestros insights y de nuestra visibilidad del plano de datos.

Como se muestra en la figura 7 que aparece a continuación, accediendo a la vista de agente a agente y examinando Path Visualization a las 07:34 CST el 24 de julio de 2024, podemos ver cómo se ha enrutado el tráfico en el plano de datos, justo un minuto antes de que el equipo de operaciones de red decidiera cambiar la ruta.

La visualización de la ruta de reenvío indica que el tráfico se enruta mediante interconexión directa con Oracle AS 31898
Figura 7. La visualización de la ruta de reenvío indica que el tráfico se enruta mediante interconexión directa con Oracle AS 31898

Examinar la ruta del plano de datos en la línea temporal es de gran importancia, ya que permite conseguir una comprensión clara del flujo del tráfico, antes, durante o después de haber implementado los cambios, como se muestra en la figura 8.

El agrupamiento de interfaces según la red hace patente que el tráfico se está enrutando mediante interconexión directa
Figura 8. El agrupamiento de interfaces según la red hace patente que el tráfico se está enrutando mediante interconexión directa

Un minuto después, a las 07:35 CST, el equipo de operaciones de red aplicó ingeniería al tráfico de salida, lo que cambió la ruta de forma significativa. Como resultado, el tráfico se enrutó desde la original AS 210312 a AS 8298 (tránsito) antes de llegar a AS 31898 de Oracle, como se muestra en las figuras 9 y 10.

Path Visualization muestra claramente otra ruta de reenvío
Figura 9. Path Visualization muestra claramente otra ruta de reenvío

El agrupamiento de interfaces según la red indica claramente un cambio en la ruta de reenvío
Figura 10. El agrupamiento de interfaces según la red indica claramente un cambio en la ruta de reenvío

¿Por qué importa? 

Todos aspiramos a la excelencia operativa Sin embargo, en entornos que son cada vez más complejos, conseguir la excelencia operativa puede parecer abrumador. Los riesgos son altos. Los resultados adversos de la ingeniería del tráfico con frecuencia dan como resultado caídas y filtraciones de ruta y, con más frecuencia de lo deseable, generan pérdidas monetarias y de reputación para las organizaciones.

Durante demasiado tiempo, la comunidad de ingenieros de redes se ha visto lastrada por tener que depender de herramientas que no eran óptimas. Estas herramientas de visualización, repartidas por Internet, y las soluciones que utilizan los datos del plano de control, nos han dejado con frecuencia en la duda sobre la efectividad de nuestra ingeniería del tráfico y el estado de nuestras redes.

ThousandEyes da carpetazo a este problema. Con alertas y monitorización BGP en tiempo casi real, le proporcionamos una visibilidad sin precedentes en relación con la propagación de sus prefijos desde la perspectiva de cientos de monitores estratégicamente desplegados por todo el mundo. Ahora, cuando comprueba cómo está la cosa desde la perspectiva de la tabla de enrutamiento, ThousandEyes proporciona visibilidad de los efectos de la ingeniería del tráfico desde distintos puntos de visibilidad en todo el mundo, casi al instante. Se consiguen los efectos de cientos de herramientas de visualización al mismo tiempo, solo que esta es más fiable, más rápida y con un mejor diseño.

Y esto no es todo. Con Path Visualization, no solo le mostramos los efectos de la ingeniería del tráfico de salida, que puede verse en el ejemplo anterior, sino que lo hacemos desde la perspectiva del plano de datos. El mismo plano de datos por el que se enrutan el tráfico de producción y de los clientes. En este caso, podemos ver los efectos del reenvío y la inversión. 

¿Cuántas veces ha llamado a un partner de interconexión para que ejecute MTR en la ruta inversa solo para descubrir que es ahí donde estaba el problema? ¿Cuánto tarda? Todos hemos pasado por esta experiencia y nos merecemos algo mejor.

Con nuestras recientes mejoras en el producto, incluidas las alertas y la monitorización BGP en tiempo casi real, junto con las ventajas de Path Visualization y la señal de alta calidad que es enseña de ThousandEyes, por fin lo hemos conseguido (y es mucho mejor).


Vea estas mejoras por sí mismo iniciando una prueba gratuita o véalas a través de nuestro Sharelink


Upgrade your browser to view our website properly.

Please download the latest version of Chrome, Firefox or Microsoft Edge.

More detail