¿Recuperación ante desastres y planificación de la continuidad del negocio? Haga estas preguntas | Liderazgo de TI


Participar en la recuperación ante desastres requiere que una empresa piense en muchas cosas, pero a pesar de las largas listas de verificación que se crean para lograr la recuperación ante desastres, hay algunas áreas que con frecuencia se pasan por alto en la planificación de la continuidad del negocio y la recuperación ante desastres.

Por ejemplo, quienes exploran la recuperación ante desastres a menudo se concentran de manera singular en proteger sus servidores y datos y, por supuesto, esos son extremadamente importantes. Sin embargo, no capturan la imagen completa. Es imperativo abordar todas las áreas de preocupación antes de que ocurra un desastre, no durante o después del evento.

Asegúrese de haber analizado detenidamente las respuestas únicas de su empresa a las siguientes preguntas críticas para ayudar a garantizar la supervivencia de su organización en caso de un desastre.

¿Qué deben hacer los empleados?

Esta pregunta ha evolucionado en el mundo Covid-19, pero suscita la discusión, ya que lo que definirá el mundo post-Covid cambia todos los días. Dependiendo del desastre (por ejemplo, incendio, inundación, huracán), la oficina de su empresa podría estar fuera de servicio durante algún tiempo. Si su oficina no es accesible, ¿cómo deben trabajar los empleados?

Es genial que sus servidores y datos hayan fallado con éxito, pero ¿de qué sirve si sus empleados no pueden acceder a ellos? Durante un desastre no es el momento de empezar a luchar para encontrar soluciones.

Anteriormente, recomendé que las empresas tengan una política de trabajo desde casa y la infraestructura requerida en su lugar, específicamente aquellas que puedan manejar la escala o escalar fácilmente para respaldar a toda la fuerza laboral. Nada encanecerá el cabello de un administrador de sistemas más rápido que tratar con toda una empresa que intenta conectarse a una conexión VPN de tamaño insuficiente.

Otra recomendación es tener acuerdos previos con una empresa de administración de propiedades sobre el uso temporal de una de sus ubicaciones, o un hotel local para usar un espacio de sala de conferencias.

Pero en nuestro mundo Covid-19, trabajar desde casa es la nueva normalidad; y los túneles VPN de tamaño insuficiente han estado (o están) en proceso de dimensionarse correctamente debido al cambio masivo al trabajo remoto. Entonces, ¿esta pregunta se respondió sola? ¿Podemos publicar todos nuestro meme de celebración favorito? Quizás. Tal vez no.

Los desastres a gran escala pueden dañar los hogares de sus empleados tanto como un parque de oficinas. El huracán Sandy dejó sin electricidad a zonas importantes de Nueva York, Nueva Jersey y Pensilvania. Para algunos, esos cortes duraron semanas.

Entonces, imagine este curso de eventos: la oficina está cerrada debido a un desastre, por ejemplo, una pandemia global. Luego, digamos que un huracán deja sin electricidad al 40 por ciento de su personal crítico de TI. Teniendo en cuenta que estamos en medio de una pandemia, y siempre hay una próxima temporada de huracanes, esto no está fuera de lo posible.

En este escenario, ¿pueden sus sistemas permitirse que el personal no esté disponible durante varios días? ¿Tiene suficiente diversidad / redundancia de habilidades para superar una pérdida de personal temporal del 40 por ciento? ¿Qué pasa si todos sus DBA están en ese grupo afectado?

Si es una empresa nacional o global con empleados dispersos en regiones geográficas, tal vez tenga redundancia de habilidades en todas las regiones. Pero, ¿y si es una empresa más pequeña con una sola oficina? Quizás pueda abrir la oficina, solo para personal crítico. Con una mano de obra pequeña, el distanciamiento social podría ser posible.

Quizás solo envié un escalofrío por la columna vertebral de su oficial de riesgos corporativos. ¿Quizás sus empleados puedan ir a casas de amigos o familiares? ¿Quizás la empresa simplemente buscará habitaciones de hotel para el personal crítico para que puedan trabajar socialmente distantes?

¿Qué es el plan de recuperación?

Ha ocurrido un desastre y sus procesos han funcionado. ¡Sus datos, aplicaciones y servidores han fallado con éxito! Impresionante. Saquemos el champán, golpeemos los cuernos de aire, despeguemos el confeti, hagamos todas las cosas de celebración (personalmente, estoy tirando el cartón y rompiendo un molino de viento para hacer un combo de retroceso para las edades).

Es genial que su plan de recuperación ante desastres haya funcionado, pero ¿cuáles son los próximos pasos? ¿Se queda permanentemente en su sitio de DR? Si no es así, ¿cómo va a realizar la conmutación por recuperación de sus datos?

Tener un plan de recuperación es tan crítico como tener un plan de recuperación ante desastres. ¿Cuáles son esos procesos? Por ejemplo, si está utilizando la replicación de almacenamiento, ¿necesita rehacer todo el proceso de configuración / inicialización? ¿Puede su proceso continuar donde se detuvieron los dispositivos de almacenamiento originales? ¿O necesita crear una instancia completa del almacenamiento en la ubicación original?

Algunas soluciones cambian automáticamente la dirección de la replicación de datos como parte de la conmutación por error. Pero, ¿qué pasa si el sitio original está fuera de línea durante un tiempo prolongado? ¿Cuánto tiempo puede almacenar los cambios de datos antes de que la ubicación original esté demasiado atrasada? O, ¿qué sucede si utiliza una empresa de recuperación ante desastres para alojar su recuperación ante desastres? ¿Hay cargos más altos o adicionales por hacer funcionar sus sistemas de producción actuales fuera de sus instalaciones durante un período prolongado?

Tal vez se encuentre en uno de esos elegantes entornos de nube pública, y no importa si se encuentra en una región / zona de disponibilidad diferente. ¡Abraza el cambio y viva la US-West-2!

Los planes de conmutación por recuperación pueden ser complicados y costosos, incluso cuando se han pensado y practicado. Es posible que las pruebas prácticas no sean posibles, pero definitivamente puede asegurarse de que su empresa lo piense, hable sobre ello, realice ejercicios de mesa y trabaje con libros de ejecución teóricos. Estar preparado puede significar la diferencia entre el éxito y el fracaso.

¿Está la infraestructura de respaldo en el sitio de recuperación ante desastres?

Esta pregunta es similar a la conmutación por recuperación, pero algo diferente. Su proceso de recuperación ante desastres funcionó a la perfección. Ahora se está quedando sin su sitio de recuperación ante desastres. Genial. ¿Necesita preocuparse por las copias de seguridad y las restauraciones? Steve, del equipo de CRM, acaba de borrar accidentalmente todos los datos del cliente. ¿Cómo está abordando eso? ¿Tiene una réplica de la infraestructura de recuperación ante desastres en su sitio de recuperación ante desastres? Genial. Haga como una aventura para elegir su propia aventura y pase a la siguiente sección.

¿Aún aquí? ¿Cuál es el plan para sus copias de seguridad? Aún es necesario realizar copias de seguridad y restauraciones. Esos problemas no quedan en suspenso debido a desastres; y si sus opciones de conmutación por recuperación están particularmente involucradas, es posible que esté trabajando fuera de su sitio de recuperación ante desastres durante un tiempo prolongado. Los “Steves” del mundo son su propio desastre andante.

¿Cuáles son algunas opciones? Si se encuentra en una de las infraestructuras en la nube, sus sistemas de respaldo pueden incluirse fácilmente en sus planes de recuperación ante desastres o recrearse fácilmente en su nueva zona de disponibilidad o región. Si se trata de una solución local, la implementación de un par de replicación puede ser un resultado muy bueno. O tener un proceso implementado para utilizar la infraestructura de respaldo existente en esa ubicación si se trata de un sitio de trabajo para su empresa.

Algunas empresas tienen planes con sus proveedores de TI para adquirir rápidamente la infraestructura necesaria e implementarla lo antes posible después del desastre. ¿Por qué comprarlo hasta que lo necesite absolutamente? Guarde su dinero hasta que sea necesario. Si bien es una solución aceptable, no soy un fanático. Deja demasiadas variables para mi gusto. ¿Habrá stock en ese momento? ¿Otras personas intentarán comprar exactamente los mismos artículos? ¿Habrá retrasos en el envío? ¿Está absolutamente seguro de que el centro de datos / colo puede soportarlo física o eléctricamente? Esto es mucho para dejar para el último minuto.

DRaaS: ¿Cuántos en el área usan el mismo proveedor?

La subcontratación de la recuperación ante desastres a una empresa externa puede ser una gran solución. Pero, ¿están preparados para un desastre regional mayor? ¿Con cuántas otras empresas como la suya están haciendo negocios? ¿Cuántas empresas en su región también tienen planes de recuperación ante desastres que incluyen el uso de sus instalaciones en Phoenix, Atlanta o Las Vegas?

Si algo como un huracán pasara por el noreste, ¿su compañía de RD podría manejar muchas compañías que fallan en la misma instalación? ¿Cuántos otros clientes tiene su administrador de DR “dedicado”? ¿Recibirá la atención y el servicio necesarios en su momento de necesidad? ¿O se distraerán gravemente con otros 10 o 15 clientes en la misma situación exacta?

Sí, estoy presentando una situación bastante extrema. Pero los desastres naturales son más frecuentes que nunca. Los huracanes azotan las costas con mayor frecuencia y toda la costa oeste es susceptible a los incendios. ¿Debería evitar utilizar un proveedor externo? No necesariamente. Solo manténgase informado, haga preguntas y establezca expectativas realistas. Si no obtiene las respuestas que le gustan, explore direcciones alternativas, como usar un proveedor diferente o uno de los proveedores de la nube.

Planifique con anticipación

Espero que estas preguntas te hayan hecho reflexionar. La recuperación ante desastres es un área de TI masiva que viene en muchos sabores, muchos de los cuales parecen menores hasta que los repasa.

Saber en lo que se está metiendo y tener un plan sólido puede marcar la diferencia entre el éxito y el fracaso, y la continuidad de su negocio.


Hank Yee es Arquitecto de Soluciones / Gerente de Entrega, TI híbrida y Servicios en la Nube en Anexinet.

.



Source link