ITILF_T066 Gestión de Incidentes

Plataformas de Aprendizaje Autodirigido

Propósito de la práctica de Gestión de incidentes.

  • El propósito es minimizar el impacto negativo de los incidentes al restaurar la operación normal del servicio lo más pronto posible.
  • Definición de Incidente.
    • Es una interrupción no planeada a un servicio o la reducción en la calidad de un servicio.

 

Actividades clave de la práctica de gestión de incidentes.

  • Identificación: Puede ingresar en forma proactiva (monitoreo) o reactiva (avisos del usuario).
  • Registro: Todos los incidentes deben ser registrados. En caso de detectar un Incidente al resolver otro, se debe abrir un nuevo registro.
  • Categorización: Se debe definir correctamente la granularidad del árbol de categorización.
  • Priorización: Se define en base al impacto y la urgencia.
  • Diagnóstico inicial: Se utiliza para esto los scripts de diagnóstico y la base de datos de errores conocidos (KEDB). En esta actividad se intentará resolver el incidente en un primer nivel de atención.
  • Escalamiento
    • Funcional: Escalamiento realizado entre los distintos grupos de soporte según el nivel de conocimiento que se requiera o ante SLA vencidos.
    • Jerárquica: Escalamiento realizado generalmente hacia Directores o personal jerárquico, ante la ocurrencia de un Incidente de alto impacto al negocio. El escalamiento puede ser tanto informativo como para requerir algún tipo de acción.

 

  • Los incidentes deben ser registrados (herramienta) y gestionados para asegurar que se resuelven en el tiempo para cumplir las expectativas del cliente y usuario.
  • Los tiempos objetivo de resolución deben ser acordados, documentados y comunicados para asegurar que las expectativas son realistas.
  • Los incidentes deben ser priorizados basado en una clasificación de acuerdo al impacto, al negocio y la urgencia para ser resueltos.

Ejemplo de priorización de la incidencia

  • Los incidentes pueden ser diagnosticados y resueltos por personas en diferentes grupos dependiendo de la complejidad y tipo de incidente.
  • Las personas que trabajan en un incidente deben proporcionar actualizaciones de calidad y en tiempo sobre el progreso, impacto, síntomas, etc.

Diagnóstico y resolución de incidentes.

Investigación y diagnóstico: Involucra actividades como entender el orden cronológico de eventos que causaron el incidente, búsquedas a la KEDB.

Resolución y recuperación: Involucra la resolución del incidente, para lo cual se pueden usar los siguientes métodos:

  • Realizarlo conjuntamente con el usuario.
  • Resolverlo remotamente.
  • Utilizando un grupo de soporte presencial.
  • Contactando un proveedor externo.

Cierre: Esta actividad será realizada siempre por la Mesa de Servicio. La Mesa de Servicio deberá validar junto con el usuario el cierre del incidente. También deberá verificar lo siguiente: que el incidente se encuentre documentado correctamente.

  • Grupos de personas que pueden diagnosticar y resolver incidentes.
    • Autoservicio (Usuarios).
    • Mesa de Servicio.
    • Equipo de soporte (Incidentes más complejos y que deben ser escalados).
    • Proveedores o socios (Productos y servicios específicos).
    • Equipos temporales con representantes diversos (internos y externos para incidentes complejos y mayores).
    • Plan de recuperación de desastres (Casos extremos).

 

Diseñar la práctica de Gestión de Incidentes.

  • Las organizaciones deben diseñar su práctica de gestión de incidentes para proporcionar una gestión adecuada y la asignación de recursos a los diferentes tipos de incidentes. Los incidentes de bajo impacto deben gestionarse de manera eficiente para que no consuman demasiados recursos. Los incidentes de alto impacto pueden requerir más recursos y una gestión más compleja:
    • Para proveer adecuada administración y asignación de recursos.
    • Para administrar incidentes de bajo impacto eficientemente.
    • Para asegurarse de que la Información sobre incidentes se almacena en registros de incidentes en una herramienta adecuada. Esta herramienta también debe proporcionar enlaces a elementos de configuración eufóricos, cambios, problemas, errores conocidos y otros conocimientos para permitir un diagnóstico y una recuperación rápida y eficiente.

 

Gestión de Incidentes en la Cadena de Valor del Servicio.

La tabla siguiente muestra una visión general de alto nivel de la contribución de esta práctica a cada una de las actividades de la cadena de valor del servicio.

Actividad de la cadena de valor Nivel de calor (de bajo a alto)
Plan 0
Mejorar 2
Involucrar 3
Diseño y Transición 2
Obtener/Construir 2
Entrega y soporte 3

Como se muestra en la tabla, la práctica de gestión de incidentes contribuye a todas las actividades de la cadena de valor, excepto la actividad del plan:

  • Mejorar: Un insumo clave para las actividades de mejora son los registros de incidentes, que se priorizan en términos de frecuencia y gravedad de incidentes.
  • Participar: La gestión de incidentes requiere una comunicación regular, para comprender los problemas, establecer expectativas, proporcionar actualizaciones de estado y acordar que el problema se ha resuelto para que el incidente pueda cerrarse.
  • Diseño y transición: pueden producirse incidentes en entornos de prueba, durante el lanzamiento del servicio y la implementación. La práctica de gestión de incidentes garantiza que estos incidentes se resuelvan de manera oportuna y controlada.
  • Obtener/construir: También pueden producirse incidentes en entornos de desarrollo. La práctica de gestión de incidentes garantiza que estos incidentes se resuelvan de manera oportuna y controlada.
  • Entrega y soporte: La actividad de la cadena de valor de entrega y soporte incluye la resolución de incidentes y problemas.