Propósito de la práctica de Gestión de incidentes.
- El propósito es minimizar el impacto negativo de los incidentes al restaurar la operación normal del servicio lo más pronto posible.
- Definición de Incidente.
- Es una interrupción no planeada a un servicio o la reducción en la calidad de un servicio.
Actividades clave de la práctica de gestión de incidentes.
- Identificación: Puede ingresar en forma proactiva (monitoreo) o reactiva (avisos del usuario).
- Registro: Todos los incidentes deben ser registrados. En caso de detectar un Incidente al resolver otro, se debe abrir un nuevo registro.
- Categorización: Se debe definir correctamente la granularidad del árbol de categorización.
- Priorización: Se define en base al impacto y la urgencia.
- Diagnóstico inicial: Se utiliza para esto los scripts de diagnóstico y la base de datos de errores conocidos (KEDB). En esta actividad se intentará resolver el incidente en un primer nivel de atención.
- Escalamiento
- Funcional: Escalamiento realizado entre los distintos grupos de soporte según el nivel de conocimiento que se requiera o ante SLA vencidos.
- Jerárquica: Escalamiento realizado generalmente hacia Directores o personal jerárquico, ante la ocurrencia de un Incidente de alto impacto al negocio. El escalamiento puede ser tanto informativo como para requerir algún tipo de acción.
- Los incidentes deben ser registrados (herramienta) y gestionados para asegurar que se resuelven en el tiempo para cumplir las expectativas del cliente y usuario.
- Los tiempos objetivo de resolución deben ser acordados, documentados y comunicados para asegurar que las expectativas son realistas.
- Los incidentes deben ser priorizados basado en una clasificación de acuerdo al impacto, al negocio y la urgencia para ser resueltos.
Ejemplo de priorización de la incidencia
- Los incidentes pueden ser diagnosticados y resueltos por personas en diferentes grupos dependiendo de la complejidad y tipo de incidente.
- Las personas que trabajan en un incidente deben proporcionar actualizaciones de calidad y en tiempo sobre el progreso, impacto, síntomas, etc.
Diagnóstico y resolución de incidentes.
Investigación y diagnóstico: Involucra actividades como entender el orden cronológico de eventos que causaron el incidente, búsquedas a la KEDB.
Resolución y recuperación: Involucra la resolución del incidente, para lo cual se pueden usar los siguientes métodos:
- Realizarlo conjuntamente con el usuario.
- Resolverlo remotamente.
- Utilizando un grupo de soporte presencial.
- Contactando un proveedor externo.
Cierre: Esta actividad será realizada siempre por la Mesa de Servicio. La Mesa de Servicio deberá validar junto con el usuario el cierre del incidente. También deberá verificar lo siguiente: que el incidente se encuentre documentado correctamente.
- Grupos de personas que pueden diagnosticar y resolver incidentes.
- Autoservicio (Usuarios).
- Mesa de Servicio.
- Equipo de soporte (Incidentes más complejos y que deben ser escalados).
- Proveedores o socios (Productos y servicios específicos).
- Equipos temporales con representantes diversos (internos y externos para incidentes complejos y mayores).
- Plan de recuperación de desastres (Casos extremos).
Diseñar la práctica de Gestión de Incidentes.
- Las organizaciones deben diseñar su práctica de gestión de incidentes para proporcionar una gestión adecuada y la asignación de recursos a los diferentes tipos de incidentes. Los incidentes de bajo impacto deben gestionarse de manera eficiente para que no consuman demasiados recursos. Los incidentes de alto impacto pueden requerir más recursos y una gestión más compleja:
- Para proveer adecuada administración y asignación de recursos.
- Para administrar incidentes de bajo impacto eficientemente.
- Para asegurarse de que la Información sobre incidentes se almacena en registros de incidentes en una herramienta adecuada. Esta herramienta también debe proporcionar enlaces a elementos de configuración eufóricos, cambios, problemas, errores conocidos y otros conocimientos para permitir un diagnóstico y una recuperación rápida y eficiente.
Gestión de Incidentes en la Cadena de Valor del Servicio.
La tabla siguiente muestra una visión general de alto nivel de la contribución de esta práctica a cada una de las actividades de la cadena de valor del servicio.
Actividad de la cadena de valor | Nivel de calor (de bajo a alto) |
Plan | 0 |
Mejorar | 2 |
Involucrar | 3 |
Diseño y Transición | 2 |
Obtener/Construir | 2 |
Entrega y soporte | 3 |
Como se muestra en la tabla, la práctica de gestión de incidentes contribuye a todas las actividades de la cadena de valor, excepto la actividad del plan:
- Mejorar: Un insumo clave para las actividades de mejora son los registros de incidentes, que se priorizan en términos de frecuencia y gravedad de incidentes.
- Participar: La gestión de incidentes requiere una comunicación regular, para comprender los problemas, establecer expectativas, proporcionar actualizaciones de estado y acordar que el problema se ha resuelto para que el incidente pueda cerrarse.
- Diseño y transición: pueden producirse incidentes en entornos de prueba, durante el lanzamiento del servicio y la implementación. La práctica de gestión de incidentes garantiza que estos incidentes se resuelvan de manera oportuna y controlada.
- Obtener/construir: También pueden producirse incidentes en entornos de desarrollo. La práctica de gestión de incidentes garantiza que estos incidentes se resuelvan de manera oportuna y controlada.
- Entrega y soporte: La actividad de la cadena de valor de entrega y soporte incluye la resolución de incidentes y problemas.