Dokumentowanie przerwy w badaniu pośmiertnym

14

W ubiegłym tygodniu mieliśmy dość poważną awarię, która wpłynęła na szereg usług, które wykluczają nas z umowy SLA z klientami. Teraz, gdy wszystko zostało rozwiązane, przeprowadzam sekcję zwłok.

Na podstawie tej recenzji chciałbym opracować wewnętrzny dokument opisujący awarię, jej skutki, naszą reakcję i rezolucję. Chcę wymyślić dość standardowy formularz do ponownego użycia w przyszłości. Poniżej zamieściłem swoje przemyślenia, ale jakie inne elementy powinny zostać uwzględnione? Gdyby to był incydent związany z bezpieczeństwem, co byś dodał?

  • Podsumowanie Podsumowanie wydarzenia na poziomie wykonawczym.
  • Usługi, których dotyczy problem
  • Wpływ Jaki był wpływ na naszych użytkowników i umowy SLA? Czy był koszt w dolarach, nieodebrane transakcje, utraceni klienci itp.?
  • Czas trwania awarii Dla każdej usługi, której dotyczy problem, jeśli wystąpiły odchylenia
  • Przyczyna W tym pierwotne i wtórne przyczyny
  • Rozkład
  • Oś czasu zdarzeń Powiadomienia, kontakt z zewnętrznymi dostawcami, powiadomienia klientów, odpowiedzi itp.
  • Problemy z naszą odpowiedzią Czy nasza reakcja na awarię nie poszła zgodnie z planem? Odpowiednie osoby powiadomione? Czy sprzedawcy wywiązali się z zaciągniętych zobowiązań?
  • Środki zapobiegawcze, jakie należy podjąć W jaki sposób zapobiegamy ponownemu wystąpieniu awarii lub zmniejszamy jej wpływ?
  • Metoda wykrywania Jak dobrze wykryliśmy tę awarię i jak poprawimy wykrywanie w przyszłości?
  • Zmiany, które należy wprowadzić w przyszłych reakcjach na awarie

Spróbuj ograniczyć liczbę postów do jednego elementu i wyjaśnienia, a ten post może być aktualizowany przy użyciu najczęściej głosowanych odpowiedzi.

Doug Luxem
źródło

Odpowiedzi:

6

Chociaż można to uwzględnić w zalecanych środkach zapobiegawczych, zaleciłbym sekcję Metoda wykrywania , w której można by zanotować, jakie były prawdziwe objawy i jak można wykryć problem (szybciej), jeśli się powtórzy, najlepiej przy użyciu automatyzacji.

JayC
źródło
Dodano do wiki
Doug Luxem
2

Wygląda dobrze. Dodałbym tylko:

Skutki / Konsekwencje : Jaka jest konsekwencja awarii - na kogo to wpłynęło, które umowy SLA zostały naruszone (jeśli w ogóle), czy były jakieś skutki uboczne?

znak
źródło
1

Usługi, których dotyczy problem, i czas trwania awarii informują tylko o tym, jak źle była awaria. Chcesz także wiedzieć, jaki był wpływ na biznes.

Wpływ : Jaki to miało wpływ na użytkowników i jak było postrzegane? Ile to nas kosztowało (brak umowy SLA, utracone zamówienia itp.)?

8996
źródło
Podoba mi się rozróżnienie między usługami dotkniętymi skutkami a wpływem firmy, ale określiłbym to mianem „Wpływu na biznes”, a nie tylko wpływu (w celu odróżnienia go od informacji o usługach / czasie trwania). Dodatkowo przyciągnie uwagę kierownictwa, który musi zdawać sobie sprawę z wpływu na biznes, jeśli nie wszystkie szczegóły techniczne dotyczące tego, na jakie usługi miało to wpływ ...
Milner
1

Publiczne wydanie i wewnętrzne wydanie

Jest to coś więcej do podjęcia przez kierownictwo, ale możesz zdecydować, co należy przekazać klientom w związku z tym lub zaleceniem. Tak czy inaczej, wypisz się z kierownictwa na dokładne sformułowanie tego, co zostanie udostępnione klientom przed wypuszczeniem czegokolwiek.

Publikacja publiczna powinna być uwzględniona w tym dokumencie, aby każdy w firmie wiedział, co wolno mu powiedzieć klientom.

SpaceManSpiff
źródło
Myślę, że ten wewnętrzny dokument mógłby zostać wykorzystany do wygenerowania zewnętrznego wydania dla klientów. Dokładnie to, co powie się klientom, będzie zależeć od naszych kierowników i marketingu / komunikacji.
Doug Luxem