Cómo asegurar la continuidad de negocio ante desastres: claves para evitar que tu empresa ‘vaya a cero’
Hasta hace pocos días la expresión de 'ir a cero' no era muy conocida por el gran público. Pero acontecimientos como un apagón a gran escala la han popularizado. Y como dice el dicho, no nos acordamos de Santa Bárbara hasta que truena. Y aunque no ha sido ni trueno, ni una gran tormenta, ha sido una importante llamada de atención.
Muchas empresas han vivido de primera mano el riesgo que supone no estar lo suficientemente preparados para una eventualidad que puede llegar a llevar a cero un negocio, comprometiendo su propia supervivencia. Las estrategias de Continuidad de Negocio llevan tiempo entre nosotros, pero es en situaciones como esta cuando somos conscientes de su relevancia, y también de la complejidad que lleva consigo.
No es suficiente contar con una solución de Recuperación frente a Desastres; si no se contemplan todas las piezas pueden surgir sorpresas desagradables.
La importancia de analizar los riesgos para establecer los parámetros clave
A veces se asume que, si contamos con una solución de Recuperación frente a Desastres, ya estamos protegidos. Y aunque es una pieza fundamental, no es ni mucho menos suficiente. Si no contemplamos todas las piezas nos podemos encontrar con sorpresas desagradables.
El punto de arranque es conocer en detalle nuestro negocio, los sistemas IT que lo proporcionan y los equipos humanos que le dan soporte. Una herramienta como el Análisis de Riesgos permite identificar el impacto que tendría el no poder ofrecer distintas funcionalidades de nuestros servicios en distintos intervalos de tiempo, por ejemplo, media hora, cuatro horas, un día, semanas, etc.
Este impacto se puede analizar a distintos niveles, como el impacto económico (ingresos que no vamos a percibir o penalizaciones económicas a los que podemos estar sujetas), a nivel incluso legal y también reputacional.
De este análisis podemos obtener requisitos de dos de los parámetros más habituales en Continuidad de Negocio y Recuperación frente a Desastres, que son el RTO y el RPO.
- RTO (Recovery Time Objective) indica el tiempo que se tarda en recuperar un sistema.
- RPO (Recovery Point Objective) indica el punto temporal antes del desastre del que podemos recuperar sin pérdida de datos.
Combinando los requisitos del análisis de riesgos, así como las distintas soluciones técnicas con las que están desarrollados nuestros servicios, podremos hacer un primer diseño de las medidas a adoptar.
Este proceso no es sencillo y aquí entra un factor muy relevante, que es el coste. Si invertimos más, mejoraremos nuestros valores de RTO y RPO, pero desgraciadamente, los presupuestos para estas actividades son limitados, y a menudo, por otras muchas urgencias, no están entre las prioridades más altas.
■ Identificar qué elementos son imprescindibles o estimar la capacidad necesaria para una situación temporal de contingencia ayuda a optimizar la solución.
La importancia de contemplar todos los escenarios y recursos
Por otro lado, es imprescindible analizar los posibles escenarios de fallos y ser conscientes de los escenarios para los que nos estemos protegiendo al implementar una determinada solución. De nada serviría contar con una solución que nos levante nuestros servidores en otra ubicación si no hemos contemplado la conectividad necesaria para que nuestros usuarios y clientes puedan acceder.
Un aspecto en el que a veces no se hace mucho hincapié es el tema de los recursos humanos. No es un tema exclusivamente de servidores, máquinas y redes. Tan importante como esto es tener claro cómo deben responder los equipos, qué tienen que hacer o simplemente, cómo y quién tiene que activar los procedimientos de recuperación.
En algunos casos puede ser evidente, como una pérdida completa de infraestructura, pero en otros, más centrados a nivel de aplicación, puede no ser tan sencillo evaluar qué está ocurriendo o qué medidas deben tomarse.
La Continuidad de Negocio implica revisar continuamente el diseño, los escenarios y mejorar tras cada contingencia.
Otro aspecto relevante es la ejecución de pruebas periódicas. No es algo sencillo, porque habitualmente una prueba puede afectar a la prestación de nuestros servicios. Aquí, afortunadamente, la tecnología está permitiendo realizar cada vez más pruebas no disruptivas, que nos sirven para darnos la confianza de que si nos encontramos en una incidencia real, estamos preparados y no encontramos sorpresas.
Por otro lado, tal y como un gran apagón puede poner de manifiesto, la Continuidad de Negocio es un proceso continuo en el que hay que revisar la validez del diseño, los escenarios que contemplamos, y en el caso de que hayamos tenido una contingencia, revisar la ejecución e identificar puntos de mejora.
Soluciones para asegurar la continuidad de negocio
En Telefónica Tech contamos con capacidades de consultoría para acompañar a nuestros clientes en el diseño de políticas de continuidad de negocio. Además, en el servicio Telefónica Tech Cloud Platform contamos con soluciones de Recuperación frente a desastres (DRaaS) que permiten salvaguardar la infraestructura de cliente en caso de desastre y automatizar réplicas geográficas entre distintos nodos.
Estas soluciones permiten también realizar pruebas de una manera no disruptiva y permite afinar esos pequeños detalles que no siempre se tienen en cuenta en el diseño inicial. Por ejemplo, un caso habitual que se detecta en las pruebas es no contemplar todas las conectividades necesarias para que los usuarios finales puedan consumir los servicios.
No te olvides de la Continuidad de Negocio si no quieres que tu negocio vaya a cero.