Mam produkt, którego w ciągu ostatnich pięciu lat wysłaliśmy około 500 jednostek. Ten produkt nie jest przeznaczony do serwisowania przez użytkownika; awaria dowolnego elementu powoduje wymianę urządzenia. Większość tych jednostek nigdy nie widziała problemów i nadal działa dobrze. Niektóre zostały uszkodzone i wróciły do naprawy.
Jak mógłbym zająć się obliczaniem średniego czasu do awarii (MTTF)? Czy uwzględnię tylko te jednostki, które zawiodły? Czy też powinienem wziąć pod uwagę wszystkie działające jednostki? A co z faktem, że mam tylko datę sprzedaży, a nie datę instalacji? I że nie wiem, jaki ułamek czasu zainstalowanego urządzenia działa? Czy powinienem przyjąć rozsądne założenia?
statistics
mathematics
failure-analysis
Stephen Collings
źródło
źródło
Odpowiedzi:
Po pierwsze, zawsze pamiętaj, że śmieci w = śmieci w; więc jeśli twoje dane są śmieciami, to statystyki będą śmieciami.
W tej sytuacji optymalne dane byłyby podobne do Run Hours Until Failure, a cały zestaw danych już by się nie udał. Mając to na uwadze, możesz wybrać liczbę zachowawczą z dowolnej obliczonej statystyki.
Ponieważ masz tylko awarię od daty sprzedaży, może to zostać przesunięte w kierunku wyższego MTTF.
Ponieważ nie wszystkie Twoje produkty zawiodły, możesz przyjrzeć się mniejszej części populacji, powiedzmy przez pierwsze sześć miesięcy produkcji. Większy odsetek z nich najprawdopodobniej zawiódł (ponieważ produkt sprzedany w zeszłym tygodniu nie powinien zawieść w tym tygodniu).
Jeśli twój odsetek niepowodzeń jest nadal zbyt niski, być może będziesz musiał spróbować dopasować dane do dystrakcji, pamiętając, że masz tylko niski odsetek rozkładu, tzn. Musisz ekstrapolować z zestawu danych do dopasowanej krzywej.
Na przykład, rozkład Weibulla działałby tutaj dobrze i jest powszechnie stosowany do danych MTTF. Chodzi tutaj o to, aby dopasować proporcję zestawu danych, która zawiodła, do odpowiedniej części dystrybucji. Jeśli twój odsetek produktów w zbiorze danych, które zawiodły, wynosił 48,66%, to dopasujesz to do tego prawdopodobieństwa na hipotetycznym rozkładzie, jak pokazuje zacieniony obszar na poniższym obrazie.
Może to być jednak dość intensywne w przypadku wszystkiego poza rozkładem wykładniczym.
Inną metodą ekstrapolacji jest analiza degradacji
źródło
Jeśli nie masz twardych danych, przyjmowanie założeń (najlepiej „rozsądnych”) jest jedyną dostępną opcją. (Być może dlatego inżynierowie nazywali reguły slajdów „zgadywaczami ...”)
Nie można zignorować faktu, że jak dotąd większość jednostek nie zawiodła. Prawdopodobnym podejściem byłoby wykorzystanie znanego czasu do awarii, aby dopasować parametry modelu statystycznego procesu awarii. Musisz także sprawdzić, czy prognozy modelu są zgodne z surowymi danymi, zanim użyjesz go do prognozowania czegokolwiek.
Powszechnie stosowanym modelem w inżynierii niezawodności jest rozkład Weibulla, który może reprezentować dość szeroki zakres różnych „pierwotnych przyczyn” awarii i automatycznie dostosowuje się do zastosowania „najlepszego” kształtu krzywej prawdopodobieństwa (oczywiście w granicach) dopasuj swoje dane z prawdziwego świata.
Google znajdzie wiele trafień do „samouczka dystrybucji Weibulla” itp., Ale jeśli jesteś nowy, dobrym pomysłem jest zapoznanie się z „inżynierią niezawodności”, zanim przejdziesz do szczegółów. Dobrym miejscem do rozpoczęcia byłaby profesjonalna organizacja inżynierska, na przykład American Society for Quality (ASQ) .
Najbardziej praktycznym sposobem oszacowania byłoby użycie jakiegoś oprogramowania komputerowego zamiast zastanawiania się, jak zrobić matematykę ręcznie, ale bez bardziej szczegółowego opisu problemu trudno jest polecić jakiś konkretny pakiet.
źródło
Narzędzie statystyczne Weibull, jak zasugerowano w dwóch poprzednich odpowiedziach, jest narzędziem z wyboru do obliczeń średniego czasu do awarii (MTTF) . Na podstawie Twojego komentarza jako zdjęcia poniżej wydaje się, że Analiza Weibulla nie wygenerowała oczekiwanych rezultatów.
Większość statystyk, z którymi pracowałem, zaleca próbkę o wielkości 30 dla większości analiz statystycznych. Podejrzewam, że ograniczony rozmiar danych może nie pomóc w analizie. Proponuję zacząć od prostej kalkulacji średniej i odchylenia standardowego dla czasu do awarii na podstawie dostępnych danych. Podczas obliczania czasu do awarii na podstawie produktu może być konieczne kilka uzasadnionych założeń. Na przykład
Przy obecnej technologii i dostępnych danych możesz również sprecyzować swoje założenia.
Punkt, który robię, to dobre uzasadnione założenia, które pomogą wygenerować dobry zestaw danych. Z mojego doświadczenia wynika, że podstawowa kalkulacja średniej i odchylenia standardowego pomoże uzyskać dobry wgląd w problem.
Inną kwestią, o której należy pamiętać, jest ustalenie, czy przyczyną są awarie
Analiza przyczyn pierwotnych musi zostać przeprowadzona w przypadku awarii o specjalnej przyczynie i należy wdrożyć działania naprawcze. Awarie związane z typowymi przyczynami są tylko częścią prowadzenia działalności w konkretnej branży i z konkretną bazą klientów.
Mam nadzieję, że ta odpowiedź znajdzie rozsądne rozwiązanie tego problemu.
Bibliografia:
źródło