Мы собираем метаданные (cookie, данные об IP-адресе и местоположении) для функционирования сайта, если вы не согласны, чтобы эти данные обрабатывались, то должны покинуть сайт.

5 причин запуска процесса управления проблемами

Использование метода Кепнера и Трего для анализа проблем
1
Решение критичных инцидентов
напоминает игру в футбол
2
Наиболее распространенным решением сбоев является "перезагрузка системы"
3
Критичные инциденты повторяются,
а корневая причина так и не найдена
4
Менеджеры проблем подключаются после восстановления работоспособности
5
Большое количество ошибок
с найденным обходным решением
Для анализа основных причин и улучшения стабильности ИТ-сервисов применяется подход к решению Кепнера и Трего.
Данный метод обеспечивает эффективную основу для сбора, систематизации и оценки информации, чтобы в последствие на ее основании принять решение. Метод был разработан Чарльзом Кепнер и Бенджамином Трего в 1960-х годах, этот метод является полезным способом расследования причин проблем.
Метод Кепнера и Трего выделяет 5 шагов анализа:
1
Определение проблемы
(данный этап нужен для прояснения ситуации, выявления проблем и выбора направления)
Первый шаг имеет решающее значение, если вы не знаете, какая проблема существует, как вы можете ее исправить?
Многие пропускают эту стадию предполагая, что они знают, в чем состоит проблема , это приводит к затруднению в дальнейших шагах, и иногда приводит к тому, что из-за невыполнения этого этапа приходится к нему возвращаться находясь уже на середине пути, и пересматривать, тем самым работа проведенная до этого - потраченное впустую время.

Для этого вы можете использовать любой метод, я приведу пример использования метода "Five Ws". В оригинале методика состоит в ответе на пять вопросов:
1. Who is it about?
2. What happened?
3. When did it take place?
4. Where did it take place?
5. Why did it happen?

В случае с управлением проблемами, мы модифицируем данные вопросы:
1. Кто испытывает проблему?
2. Что случилось: каков уровень влияния, симптомы, какие ошибки или что-нибудь, что вы ожидали не произошло?
3. Когда возникла проблема, или когда она начинает происходить?
4. Где возникает проблема?
5. Почему это важно, почему проблема происходит?
2
Описание проблемы
(с точки зрения идентичности, места, времени и размера)
На этом этапе мы отвечаем на 4 вопроса по проблеме: в чем проблема, где возникает проблема, когда она произошла и уровень влияния проблемы. Часть ответов у нас уже получено на шаге №1.
Для каждого ответа мы опишем, в чем проблема (похоже на этап 1), а также то, в чем эта проблема может быть, но не есть. Использование обеих колонок позволяет описать подробно, в чем проблема, но и исключает возможные причины, которые не вызывают проблему.
3
Анализ вариантов возможных причин, анализ рисков для каждой причины
Наличие информации о том, что могло произойти, но не произошло, помогает нам объективно увидеть, какие изменения могли повлиять на работу систем.
Опыт показывает, что большинство проблем связаны с недавними изменениями, особенно для существующих систем, которые работают последнее время без проблем.
Для расширения нашего "Описания проблемы" к "Возможные причины" мы добавим еще 2 колонки, во-первых, "Различия", где перечислены различия и "Изменения", которые могли бы объяснить различия.
4
Исследование наиболее вероятных причин с выявлением потенциальных проблем и отрицательных воздействий.
Сравниваем текущее состояние с последними изменениями. С ранжированием возможных причин по вероятности. Для каждой из возможных причин спросить: "Если это является основной причиной этой проблемы, если да, объясняет ли она другие аналогичные возникшие инциденты?"
5
Проверка истинной причины, выработка мер
Сравните вероятные причины, удовлетворяют ли они описанию проблемы?
Когда вы нашли причину (root case), которая объясняет все условия, ее необходимо протестировать, чтобы подтвердить, что она является причиной. Для этого воспроизведите те же условия, и если это приводит к тем же симптомам - вы подтвердили причину.
Можно дополнительно используя метод "5 Whys" подтвердить еще раз данную причину.
Photo by Quino Al on Unsplash