Bueno, recientemente me encontré con esta noticia en la que el accidente del sitio de British Airways causó una indignación masiva con los pasajeros varados en el aeropuerto.
El CEO de British Airways se disculpa porque una “falla importante de TI” lleva a vuelos a tierra en Londres
La interrupción de £ 150 millones de BA fue causada por alguien que encendió y apagó las computadoras demasiado rápido
Bueno, lo siento por el encargado de mantenimiento de DC (Data Center), que entró allí y desconectó accidentalmente la fuente de alimentación de DC. Puedo anticipar, como vengo de la misma comunidad de ingenieros de TI, que habrá múltiples borradores del informe RCA, en el que eventualmente se lo convertirá en chivo expiatorio y tal vez lo despidan.
- ¿Debe un vibrador de litio recargable estar en el equipaje facturado o en el equipaje de mano?
- ¿Por qué está tan lejos el Aeropuerto Internacional de Denver?
- ¿Por qué el fiasco de abuso de pasajeros de United Airlines todavía se describe como una “sobreventa” por parte de las personas cuando claramente no lo fue?
- Cómo alquilar un vuelo
- ¿Cuál es el número promedio de veces que un miembro de la tripulación de una aerolínea enfrenta un aterrizaje de emergencia en su carrera?
Si me preguntas, él solo no es responsable de este desastre: interrupción de 15 minutos y pérdida de negocios en millones. Francamente, todos los sitios de TI, más apropiadamente los centros de datos, están de hecho diseñados para enfrentar tales situaciones. Y por esta razón, siempre tienen un DR (sitio de recuperación de desastres). Junto con los sitios de recuperación ante desastres, vienen las soluciones de alta disponibilidad (siempre que el cliente tenga un bolsillo), es decir, soluciones de alta disponibilidad (que garantizan el 100% de disponibilidad de la empresa). Ambos, juntos, HA y DR a menudo son vendidos por proveedores de TI.
Ahora, donde la mayoría del cliente, que compra productos de TI, no comprende, es la importancia de este sitio de DR, o prestar la debida atención a los simulacros de DR. Muchos de los clientes, incluidos los grandes nombres (que no puedo mencionar aquí por razones obvias), consideran que DR es simplemente un requisito de cumplimiento. Algo para marcar en su hoja de cálculo. Muy pocas organizaciones, de las que tengo conocimiento, ejercen con frecuencia ejercicios de recuperación ante desastres y han comparado el rendimiento del sitio de recuperación ante desastres (solución de recuperación ante desastres de un botón, OBDR). Lo que la mayoría de las organizaciones, he encontrado, es planear un simulacro de DR durante el fin de semana. Inicie el sistema en el sitio DR de una manera muy controlada. Si el sistema aparece, el DR se marca como exitoso y el sistema se inicia nuevamente en el sitio principal de DC. Tales ejercicios DR no tienen sentido. No sirve para nada. Los proveedores empresariales lo saben muy bien y siempre recomiendan tener un sitio de recuperación de desastres saludable.
Pero el cliente ignora deliberadamente el consejo del proveedor de TI que cita su presupuesto limitado. Lo sé, muchos clientes dicen que no estamos en la profesión de TI, estamos en la profesión de xyz, por lo que dedicamos recursos a nuestras áreas centrales. Tienen suerte de no haber sufrido el destino de la BA, y si alguna vez lo harían, no debería ser una sorpresa.
Un consejo sería cuidar muy bien su infraestructura de TI. Su infraestructura de TI es la columna vertebral de su organización. Solo tener una columna vertebral no te convierte en una superestrella, pero trata de ser uno sin ella.
Fuente: Google