El artículo «A Deep Dive into Lufthansa’s Software Failure: Lessons for Modern ERP» publicado el pasado 22/08/2024 en la web de la consultora ERP Panorama Consulting analiza el fallo del ERP que afectó a Lufthansa en febrero del 2023.
El fallo, que se produjo durante un mantenimiento de rutina en el centro de datos de la aerolínea en Frankfurt, provocó la cancelación de cientos de vuelos y afectó a más de 200.000 pasajeros.
Según el artículo este incidente ilustra la importancia de la resiliencia de TI en el entorno digital actual, donde las empresas dependen cada vez más de sistemas complejos e interconectados. El artículo destaca cinco lecciones clave aprendidas del fallo de software de Lufthansa:
- La importancia de los sistemas redundantes y los mecanismos de failover: Lufthansa carecía de sistemas redundantes y mecanismos de failover adecuados, lo que provocó un cierre completo de sus operaciones cuando el centro de datos principal experimentó una falla. Para evitar consecuencias similares, las empresas deben implementar planes de recuperación ante desastres, equilibrio de carga y auditorías regulares de infraestructura para identificar y mitigar las vulnerabilidades.
- El papel fundamental de los procedimientos de mantenimiento efectivos: El incidente de Lufthansa subraya la necesidad de procedimientos de mantenimiento rigurosos y cuidadosamente ejecutados. Un mantenimiento inadecuado puede introducir nuevos riesgos, como sucedió en el caso de Lufthansa. Las empresas deben realizar evaluaciones de riesgo de mantenimiento, implementar una gobernanza de TI estricta y programar el tiempo de inactividad para minimizar las interrupciones.
- La necesidad de protocolos robustos de respuesta a incidentes y comunicación: La respuesta de Lufthansa al incidente, particularmente en términos de comunicación, fue deficiente. La falta de comunicación oportuna y precisa exacerbó el impacto del fallo de software, erosionando la confianza del cliente y dañando la reputación de la aerolínea. Las empresas deben establecer planes de respuesta a incidentes bien definidos, canales de comunicación en tiempo real y revisar y mejorar sus protocolos después de cada incidente.
- El impacto de la cultura organizacional en la resiliencia de TI: Una cultura organizacional que prioriza la eficiencia operativa sobre la gestión de riesgos puede contribuir inadvertidamente a los fallos de TI. Es crucial cultivar una cultura que valore la gestión de riesgos, la mejora continua y la resolución proactiva de problemas.
- El valor estratégico de las actualizaciones y la modernización regulares del sistema: El fallo de software de Lufthansa plantea interrogantes sobre la antigüedad y la relevancia de sus sistemas de TI. Las empresas deben invertir en la actualización y modernización regulares de sus sistemas de TI, adaptando las tecnologías emergentes para mejorar la confiabilidad y el rendimiento.
El artículo concluye que el objetivo final no es simplemente evitar los fallos de ERP, sino construir un ecosistema de TI resiliente, adaptable y capaz de soportar el crecimiento y el éxito a largo plazo de la empresa.