Rápidamente, un error del sistema provoca un apagón de contenido global | Administración de redes


Por John P. Mello Jr.

9 de junio de 2021 4:00 a. M. (Hora del Pacífico)

Un error de configuración en los sistemas de un proveedor de entrega de contenido eliminó el martes numerosos sitios web y aplicaciones en todo el mundo.

El proveedor, Fastly, que brinda soporte a marcas como CNN, The Guardian, The New York Times, Hulu, Reddit, HBO Max y Spotify, experimentó la interrupción alrededor de las 5:49 am hora del este de los EE. UU. Y comenzó a recuperarse a las 6:39. soy

Según National Public Radio, durante la interrupción, los visitantes que intentaban acceder a CNN.com recibieron el mensaje “Rápidamente error: dominio desconocido: cnn.com”. En el sitio web del New York Times y del gobierno del Reino Unido, apareció un aviso de “Error 503 Servicio no disponible”, junto con la línea “Servidor de caché de barniz”. El barniz es una tecnología utilizada por Fastly.

Cuando TechNewsWorld se comunicó con TechNewsWorld sobre la interrupción, un portavoz de Fastly respondió con la siguiente declaración: “Todos los nodos de la caché Fastly ahora se han restaurado en nuestra red global. Identificamos una configuración de servicio que provocó interrupciones en nuestros puntos de presencia a nivel mundial y hemos desactivado esa configuración . ”

Redes de entrega de contenido

Fastly es lo que se conoce como red de distribución de contenido. Las CDN existen desde hace más de 20 años, aunque han evolucionado y se han expandido durante ese tiempo.

“La mayor parte del contenido de Internet con el que los usuarios interactúan es servido por redes de distribución de contenido”, observó Doug Madory, director de análisis de Internet en Kentik, una empresa de observabilidad de redes en San Francisco.

“Ha habido cierta consolidación en la industria, así que cuando hay una interrupción, se pueden eliminar muchas cosas”, dijo a TechNewsWorld.

Andy Champagne, vicepresidente senior de la oficina del CTO en Akamai, un proveedor de entrega de contenido y seguridad en la nube en Cambridge, Massachusetts, explicó que enviar contenido desde una ubicación no funcionará físicamente para los proveedores de contenido.

“No se puede construir una ubicación lo suficientemente grande, lo suficientemente conectada y lo suficientemente cerca de todo”, dijo a TechNewsWorld. “Es por eso que tenemos alrededor de 300.000 servidores en todo el mundo para distribuir contenido”.

“Cualquiera que sea una gran marca hoy en día e incluso las marcas más pequeñas están utilizando redes de entrega de contenido para distribuir su contenido”, continuó.

“Uno de los desafíos de Internet es que la escala puede tomarlo desprevenido”, dijo. “De repente, algo puede volverse extremadamente popular. De repente, la gente puede querer descargarlo, escucharlo, reproducirlo, verlo, comprarlo. Ahí es donde los CDN realmente pueden ayudar. Pueden escalar al instante”.

Reducir la latencia

Jonathan Tanner, investigador senior de seguridad en Barracuda Networks, un proveedor de soluciones de seguridad y almacenamiento con sede en Campbell, California, explicó que las redes de entrega de contenido suelen alojar contenido cargado con frecuencia, como imágenes para otros sitios web o incluso sitios web completos, de manera distribuida para permitir tiempos de carga más rápidos.

“Básicamente, alojarán el mismo contenido en varios centros de datos en todo el mundo, y cuando un usuario vaya a un sitio web que carga contenido desde la CDN, cargará ese contenido desde el centro de datos más cercano a ese usuario”, dijo a TechNewsWorld. .

“Eso quita la carga de ancho de banda de su cliente al no tener archivos más grandes cargados desde los propios servidores del cliente de CDN, y también permite una latencia más baja para los usuarios al ofrecer contenido desde una ubicación geográficamente más cercana a ese usuario que el sitio web del cliente de CDN está siendo alojado “, dijo.

“El cliente de CDN podría alojar copias de todo su sitio en varios centros de datos para lograr el mismo efecto”, agregó, “pero esto requeriría muchos más gastos generales que simplemente contratar a una empresa como Fastly que lo hace a gran escala”.

Desastre multiplicador

Aunque los detalles sobre la configuración del servicio que causó la interrupción en Fastly aún no se han hecho públicos, las CDN pueden tener muchas partes móviles y los sistemas se actualizan constantemente.

“Un proveedor generalmente prueba las actualizaciones en etapas para asegurarse de que una actualización no cause un problema”, explicó Madory. “A veces, en aras de la conveniencia, hacen cambios sobre la marcha que no pasan por las mismas pruebas rigurosas”.

Una mala configuración puede hacer que el software se bloquee por completo, o podría bloquear los recursos necesarios para que el software funcione correctamente, cualquiera de los cuales causaría una interrupción, señaló Tanner.

“Por la naturaleza misma de cómo funcionan las CDN, el mismo código y contenido se aloja en muchos centros de datos diferentes en todo el mundo”, dijo. “Por lo tanto, si se produce una mala configuración, es posible que se distribuya a todos esos centros de datos y provoque una interrupción”.

Explicó que las CDN pueden ser más resistentes a las interrupciones que otros tipos de sistemas porque si un centro de datos falla, los usuarios serán dirigidos al siguiente centro de datos más cercano para el contenido.

“Sin embargo”, agregó, “un problema con el software central en todos los centros de datos indudablemente hará que todo el servicio deje de funcionar”.

Actualiza lentamente

Si hay algo que aprender de la interrupción de Fastly, es sin duda cómo las redes distribuidas desempeñan un papel fundamental en Internet hoy en día y lo importante que es asegurarse de que el software en los sistemas distribuidos funcione correctamente.

“También ilustró con suerte un punto importante sobre cómo manejar mejor las actualizaciones en el futuro”, dijo Tanner. “Es decir, no apuntar a todos los centros de datos a la vez, sino implementar lentamente el software y verificar que funcione correctamente antes de impulsar un cambio importante”.

“Para las CDN o cualquier otra arquitectura distribuida, asegurarse de que las actualizaciones del software y las configuraciones se realicen por fases, en lugar de en todos los centros de datos a la vez, sin duda ayudará a evitar este tipo de interrupciones en el futuro”, observó.

“Para aquellos que utilizan CDN, tener un plan de acción en caso de tal interrupción también sería útil para reducir el tiempo de inactividad”, agregó.

Fastly no es el único que experimenta una interrupción que acapara los titulares.

En octubre de 2019, un ciberataque a Amazon Web Services dejó a sus clientes sin acceso a información crítica durante más de 10 horas. Mientras tanto, el año pasado, los clientes de IBM Cloud sufrieron una interrupción del servicio en junio, los clientes de Cloudflare se quejaron de que los visitantes tenían problemas para acceder a sus sitios web y servicios en julio y en noviembre, otro problema de AWS interrumpió el servicio para sus clientes de la costa este de EE. UU.



John P. Mello Jr. ha sido reportero de ECT News Network desde 2003. Sus áreas de enfoque incluyen ciberseguridad, problemas de TI, privacidad, comercio electrónico, redes sociales, inteligencia artificial, big data y electrónica de consumo. Ha escrito y editado para numerosas publicaciones, incluida la Boston Business Journal, la
Boston Phoenix, Megapixel.Net y Noticias de seguridad del gobierno. Envíe un correo electrónico a John.

.



Source link