Esta semana vimos lo más parecido a un apocalipsis digital moderno: ¡Facebook y sus aplicaciones más importantes desaparecieron de Internet durante horas!

Más allá de algunas depresiones para muchos, oportunidad de descanso de las redes sociales para otros, o incluso oportunidad de posicionamiento para otras herramientas de redes sociales, como Twitter, creo que vale la pena entender mínimamente qué pasó, ¿y quién mejor que el equipo de Cloudflare para darnos una luz?

¿Qué es Cloudflare?

Cloudflare es una de “las redes más grandes que operan en Internet”. Puedes utilizar los servicios de Cloudflare para aumentar la seguridad y el rendimiento de tus sitios web y servicios.

A nível técnico, Cloudflare “proporciona una red de entrega de contenido (CDNs), servicios de seguridad de internet y servicios de servidores de nombres de dominio distribuidos, localizados entre el visitante y el proveedor de alojamiento del usuario de Cloudflare, y que actúan como proxy inverso para sitios web.

Por tanto, si alguien fuera de Facebook podría tener una idea del problema, en el momento del caos, estos eran el equipo de Cloudflare. Por eso todos nos fuimos a Twitter, o a leer los descubrimientos de Cloudflare.

Twitter saluda a, probablemente, todos los usuarios de Redes Sociales

Cloudflare pensó que tenían problemas con sus DNS (sistemas de nombres de dominio), pero Twitter confirmó muy rápido que el problema lo tenía Facebook, WhatsApp e Instagram. Sus nombres de DNS ‘dejaron de resolverse’ y sus direcciones IP se volvieron inalcanzables.

Problema con el BGP

Según Cloudflare, desde fuera, el problema estaba relacionado con el BGP. El BGP, Border Gateway Protocol, o protocolo de puerta de enlace de frontera, es un protocolo “mediante el cual se intercambia información de encaminamiento entre sistemas autónomos”.

Básicamente es un mecanismo para intercambiar información  de enrutamiento entre sistemas autónomos en Internet. Estos enrutadores, que hacen que Internet funcione, tienen grandes listas de las posibles rutas que se actualizan constantemente y se utilizan para entregar cada paquete de red a sus destinos. Internet deja de funcionar, si no hay BGP, porque los enrutadores no saben qué hacer.

BGP es lo que une la gran red de redes que componen Internet. BGP es lo que permite a Facebook comunicar su presencia a otras redes de Internet. Si no lo hace, no está disponible.

No especularé sobre qué habrá pasado a nivel interno, por eso puedes leer lo que dice Facebook a respeto:

Problema con el ASN

Un ASN es un número de sistem autónomo, Autonomous System Number. Cada red tiene uno. Un AS (sistema autónomo) es una red individual que tiene una política de enrutamiento interna unificada.

Las siguientes son las características de un AS:

  • Controlan un grupo de direcciones IP (originan prefijos)
  • Saben cómo llegar a grupos específicos de direcciones IP (transportan prefijos)

Para que los demás sepan cómo y dónde encontrarnos el ANS de nuestra red, esta debe anunciar sus rutas de prefijo a Internet usando BGP. Cloudflare notó que Facebook había dejado de anunciar las rutas a sus prefijos de DNS. Los servidores de DNS de Facebook dejaron de estar disponibles, y Cloudflare no podía responder a las solicitudes de la dirección de IP de facebook.com.

Aparentemente Facebook y sus sitios web habían sido desconectados de Internet, y los resolutores de DNS de todo el mundo dejaron de resolver sus nombres de dominio. Porque Facebook dejó de anunciar sus rutas de prefijo de DNS a través de BGP, los resolutores de DNS de Cloudflare no tenían forma de conectarse a sus servidores de nombres, y empezaron a emitir respuestas de serverfail.

A todo esto puedes añadir el comportamiento humano, que intentando recargar las páginas, o reiniciar sus apps de forma agresiva, provocaron un efecto exponencial.

Conclusión

Para concluir, Internet es un sistema complejo e interdependiente de millones de sistemas y protocolos que trabajan juntos. Funciona gracias a una relación de confianza, estandarización y cooperación entre entidades. Entender esto te permite tener un plan para cuando vuelva a pasar lo que le ha pasado a Facebook.

Por cierto, Facebook confirmó que su interrupción se debió a una actualización de rutina.

¿Tu negocio se vió afectado por el apagón de Facebook? ¡Coméntalo abajo!

Foto: @rawpixel.com @freepik

Fuentes:

Compartir es construir