ITILF_T067 Gestión de Problemas

Plataformas de Aprendizaje Autodirigido

Propósito de la práctica de Gestión de problemas.

  • El propósito es reducir la probabilidad e impacto de los incidentes al identificar las causas potenciales y actuales de los incidentes y gestionando las soluciones temporales (workarounds) y los errores conocidos.
  • Definiciones.
    • Problema es la causa o causa potencial de uno o más incidentes.
    • Error conocido es un problema que ha sido analizado pero no ha sido resuelto.
    • Solución temporal (Workaround) es una solución que reduce o eliminar el impacto de un incidente o problema para el cual no existe todavía una solución completa. Algunas soluciones temporales reducen la probabilidad de incidentes.

Actividades.

Detección del Problema:

  • La Mesa de Servicio registra un incidente de causa desconocida con posibilidad de reaparición o un Incidente Grave.
  • El segundo nivel analiza un incidente y detecta un problema.
  • Eventos de monitoreo que generan incidentes de causa desconocida.
  • Análisis de incidentes que revelan la existencia de un problema (Gestión proactiva de problemas).

Registro: Independientemente del método de detección del problema, todos los detalles relevantes del mismo deben registrarse.

Categorización: Es importante categorizar los problemas para:

  • Rastrear la naturaleza de su origen en el futuro.
  • Obtener información de gestión significativa.

Priorización: Los problemas deben priorizarse utilizando los mismos criterios utilizados para los Incidentes.

Diagnostico.

Investigación y Diagnóstico:

  • Se realiza el diagnóstico de la causa raíz del problema, pero la naturaleza y velocidad de la investigación dependen del impacto, severidad y urgencia del mismo.
  • El CMS se utiliza para determinar el impacto y la razón de la falla del servicio.
  • Es una buena práctica revisar la KEDB antes de iniciar la investigación.
  • Es muy valioso recrear la falla para realizar el análisis.

Registrar Error Conocido (Known Error):

  • Una vez que se complete el diagnóstico del problema y que se haya encontrado una solución alternativa, se deberá registrar en la KEDB el error conocido.
  • De esta manera, si surgen nuevos incidentes o problemas relacionados, estos pueden ser resueltos rápidamente.
  • También puede detectarse la necesidad de registrar un error conocido en una fase previa al diagnóstico, a modo informativo.
  • Es muy difícil identificar el momento exacto en el que crear un error conocido, por lo tanto, debe hacerse en el momento en que se lo considere útil.

Resolución: Luego de encontrar la solución temporal y publicar el error conocido, el siguiente paso es cerrar el problema.

  • Para aplicar la solución encontrada al problema, debe considerarse la emisión del RFC, que debe manejarse dentro del proceso de Gestión del Cambio. Mientras tanto, la KEDB debe usarse para manejar la aparición de incidentes relacionados al problema que se está cerrando.

Cierre: El problema debe cerrarse luego de haber hecho la revisión del cambio. En este caso, también debe actualizarse la KEDB. En los casos en que una solución definitiva no pueda aplicarse, el problema se cierra con la información de la solución temporal y error conocido.

Revisión de Problemas Mayores: La gestión de problemas finaliza una vez realizada la revisión de los problemas mayores, con el objetivo de aprender de errores pasados.

 

Diferencia entre problema e incidente.

Los problemas están relacionados con los incidentes pero deben diferenciarse: