W wolnym czasie pracuję nad małym systemem internetowym, który gromadzi raporty o awariach (ale nie inne, niezawierające raportów o błędach) wysyłane z aplikacji Delphi Windows.
Przy rozwiązywaniu problemów użytkownicy chcieliby mieć funkcję eksploracji danych, aby znaleźć związki między wersjami sprzętu lub systemu operacyjnego a konkretnym błędem i / lub awarią.
Jako przykład, jak to powinno działać:
- dla każdej awarii znajduje się raport w bazie danych, który zawiera odcisk palca / kod skrótu śledzenia stosu (stos wywołań) w momencie awarii w celu identyfikacji duplikatów
- algorytm sprawdza, czy wszystkie duplikaty raportu o błędzie mają również inne wspólne atrybuty, na przykład brakujący dodatek Service Pack systemu operacyjnego
- wynik analizy zawiera listę wszystkich właściwości, które mają wspólne raporty o błędach
Załóżmy, że te automatyczne raporty błędów zawierają wszystkie kluczowe informacje, takie jak nazwy wszystkich aktualnie uruchomionych procesów, nazwy plików, informacje o wersji załadowanych bibliotek DLL itp.
Jak znaleźć korelacje między powtarzającymi się awariami a środowiskiem? Czy istnieją specjalne algorytmy lub metody statystyczne, które mogłyby pomóc?
Odpowiedzi:
Czy możesz wypróbować maszyny [bez awarii] tego samego użytkownika, aby uzyskać te same informacje, co w raporcie o awarii? Ponieważ wtedy można użyć regresji logistycznej do modelowania tych atrybutów (i interakcji) do prawdopodobieństwa wystąpienia awarii.
źródło