Dlaczego statystyki bayesowskie nie są bardziej popularne w statystycznej kontroli procesów?

18

Rozumiem debatę bayesowską kontra częstokroćową, że statystyki częstokrzyskie:

  • jest (lub twierdzi, że jest) obiektywny
  • lub przynajmniej bezstronny
  • tak więc różni badacze, stosując różne założenia, mogą nadal uzyskać porównywalne ilościowo wyniki

podczas gdy statystyki bayesowskie

  • twierdzi, że dokonuje „lepszych” prognoz (tj. niższych oczekiwanych strat), ponieważ może wykorzystać wcześniejszą wiedzę (między innymi)
  • potrzebuje mniej wyborów „ad hoc”, zastępując je wcześniejszymi / modelowymi wyborami, które (przynajmniej w zasadzie) mają rzeczywistą interpretację.

Biorąc to pod uwagę, spodziewałbym się, że statystyki bayesowskie będą bardzo popularne w SPC: Gdybym był właścicielem fabryki próbującym kontrolować jakość mojego procesu, martwiłbym się przede wszystkim spodziewaną stratą; Gdybym mógł to zmniejszyć, ponieważ mam więcej / lepszą wcześniejszą wiedzę niż moi konkurenci, nawet lepiej.

Ale praktycznie wszystko, co przeczytałem o SPC, wydaje się być zdecydowanie częste (tj. Brak wcześniejszych rozkładów, oszacowanie punktowe wszystkich parametrów, wiele doraźnych wyborów dotyczących wielkości próby, wartości p itp.)

Dlaczego? Rozumiem, dlaczego statystyki częstokrzyskie były lepszym wyborem w latach sześćdziesiątych, kiedy SPC wykonywano za pomocą pióra i papieru. Ale dlaczego od tego czasu nikt nie próbował różnych metod?

nikie
źródło
2
Myślę, że statystyki bayesowskie są moją cyfrową kamerą SLP, a częstym jako aparat iPhone. Oboje kiedyś kupiłem, ale używam lustrzanki cyfrowej mniej niż 5% zdjęć, podczas gdy odpoczynek telefonu to 95%. Ponieważ jest łatwy, poręczny i kieszonkowy i wiele razy zapewnia według jakości (w oparciu o moje umiejętności DSLR). Podobnie jak włączenie priorów i łańcuchów biegowych w Hayes, muszę znaleźć optymalną równowagę między czasem otwarcia, długością i innymi parametrami. Koniec iPhone'a popularny.
Ram Sharma
@RamSharma powinieneś opublikować to jako odpowiedź! Podoba mi się to bardziej niż analogia mojego noża szefa kuchni.
shadowtalker

Odpowiedzi:

18

OSTRZEŻENIE Napisałem tę odpowiedź dawno temu, nie mając pojęcia, o czym mówię. Nie mogę go usunąć, ponieważ został zaakceptowany, ale nie mogę stać za większością treści.


To bardzo długa odpowiedź i mam nadzieję, że będzie w jakiś sposób pomocna. SPC nie jest moją dziedziną, ale myślę, że te komentarze są na tyle ogólne, że mają tutaj zastosowanie.

Twierdziłbym, że najczęściej cytowaną zaletą - umiejętnością uwzględnienia wcześniejszych przekonań - jest słaba przewaga zastosowana / pola empiryczne. To dlatego, że musisz oszacować swoje wcześniejsze. Nawet jeśli mogę powiedzieć „cóż, poziom z jest zdecydowanie nieprawdopodobny”, nie mogę przez całe życie powiedzieć ci, co powinno się stać poniżej z. O ile autorzy nie zaczną publikować swoich surowych danych w masie, moje najlepsze przypuszczenia dotyczące priorów są warunkowymi momentami zaczerpniętymi z poprzedniej pracy, które mogły, ale nie muszą być dopasowane w podobnych warunkach do tych, z którymi się mierzysz.

Zasadniczo techniki bayesowskie (przynajmniej na poziomie konceptualnym) są doskonałe, gdy masz silne założenie / pomysł / model i chcesz przenieść je do danych, a następnie zobaczyć, jak źle się zachowujesz. Ale często nie chcesz sprawdzić, czy masz rację co do jednego konkretnego modelu procesu biznesowego; bardziej prawdopodobne, że nie maszmodel i szukają informacji o tym, co zrobi Twój proces. Nie chcesz wypychać swoich wniosków, chcesz, aby Twoje dane wypychały twoje wnioski. Jeśli masz wystarczającą ilość danych, tak i tak się stanie, ale w takim razie po co zawracać sobie głowę uprzedzeniem? Być może jest to zbyt sceptyczne i niechętne do podejmowania ryzyka, ale nigdy nie słyszałem o optymistycznym biznesmenie, który również odniósł sukces. Nie ma sposobu na oszacowanie niepewności co do własnych przekonań i wolałbyś nie ryzykować zbytniej pewności siebie w niewłaściwej sprawie. Ustawiasz więc nieinformacyjny przeor, a przewaga znika.

Jest to interesujące w przypadku SPC, ponieważ w przeciwieństwie do, powiedzmy, marketingu cyfrowego, procesy biznesowe nie są wiecznie nieprzewidywalne. Mam wrażenie, że procesy biznesowe zwykle zmieniają się celowo i stopniowo. Oznacza to, że masz dużo czasu na zbudowanie dobrych, bezpiecznych priorów. Przypomnijmy jednak, że w priory chodzi o propagowanie niepewności. Poza subiektywnością Bayesianizm ma tę zaletę, że obiektywnie propaguje niepewność w głęboko zagnieżdżonych procesach generowania danych. Że dla mnie jest naprawdę co statystyki Bayesa jest dobre dla. A jeśli szukasz niezawodności swojego procesu znacznie przekraczającej granicę „istotności” 1 na 20, wydaje się, że chciałbyś uwzględnić jak największą niepewność.

Gdzie są modele Bayesa? Po pierwsze, są trudne do wdrożenia. Mówiąc wprost, mogę nauczyć OLS inżyniera mechanika w 15 minut i zlecić mu wykonanie regresji i testów t w Matlabie w innym 5. Aby użyć Bayesa, najpierw muszę zdecydować, jaki model pasuję, a następnie sprawdź, czy jest gotowa biblioteka w języku, który zna ktoś w mojej firmie. Jeśli nie, muszę użyć BŁĘDÓW lub Stana. Następnie muszę uruchomić symulacje, aby uzyskać nawet podstawową odpowiedź, a to zajmuje około 15 minut na 8-rdzeniowej maszynie i7. Tyle o szybkim prototypowaniu. Po drugie, zanim otrzymasz odpowiedź, spędziłeś dwie godziny na kodowaniu i czekaniu, tylko po to, aby uzyskać taki sam efekt, jaki mógłbyś uzyskać z częstymi przypadkowymi efektami ze klastrowymi standardowymi błędami. Może to wszystko jest zarozumiałe i błędne i wcale nie rozumiem SPC.

Porównałem Bayesianizm do bardzo wysokiej jakości noża szefa kuchni, garnka stockowego i patelni sautee ; Częstotliwość jest jak kuchnia pełna narzędzi As-Seen-On-TV, takich jak krajalnice do bananów i garnki do makaronu z otworami w pokrywie ułatwiającymi opróżnianie . Jeśli jesteś doświadczonym kucharzem z dużym doświadczeniem w kuchni - w rzeczy samej, we własnej kuchni merytorycznej, która jest czysta i uporządkowana, a wiesz, gdzie wszystko się znajduje - możesz robić niesamowite rzeczy za pomocą małego wyboru eleganckie, wysokiej jakości narzędzia. Możesz też użyć szeregu różnych małych narzędzi ad-hoc *, które wymagają zerowej umiejętności, aby przygotować prosty, naprawdę niezły posiłek, który ma kilka podstawowych smaków. Właśnie wróciłeś do domu z kopalni danych i jesteś spragniony rezultatów; którym jesteś kucharzem?

* Bayes jest równie ad hoc, ale mniej przejrzysty . Ile wina jest w twoim Coq au Vin? Nie mam pojęcia, wpatrujesz się w nią, bo jesteś zawodowcem. Lub, nie możesz odróżnić Pinot Grigio od Pinot Noir, ale pierwszy przepis na Epicurious mówi o użyciu 2 filiżanek czerwonego, więc to właśnie zrobisz. Który z nich jest bardziej „ad-hoc”?

Shadowtalker
źródło
1
+1, świetna odpowiedź. Jestem ciekawy: czy mógłbyś dodać akapit o małych / adaptacyjnych rozmiarach próbek? W SPC próbki o wielkości 3-5 wydają się być powszechne. A jeśli oprogramowanie SPC może powiedzieć technikowi po 2 próbkach, czy naprawdę potrzebuje 3 dodatkowych próbek, czy nie, byłoby to świetną funkcją. W przypadku modelu bayesowskiego jest to prawie oczywiste: zdefiniuj koszt pomiarów, fałszywie dodatnie i ujemne wyniki, a następnie oszacuj oczekiwany koszt wykonania kolejnego pomiaru w porównaniu z zatrzymaniem. W statystykach dla
częstokierujących
1
Jeśli chodzi o wielkość próby, problem, o którym wspominałbym, gdybym wiedział, że próbki są tak małe, to fakt, że przy bardzo niewielu obserwacjach twoje oszacowania będą bardzo wrażliwe na twój wybór wcześniej. Nie możesz dostać krwi z kamienia, więc jest to kompromis: albo rażąco przesadzasz z częstym estymatorem, ale robisz to z kilkoma założeniami, lub włączasz swoją wiedzę (lub jej brak) do wystarczająco niejasnego wcześniejszego i zasadniczo pasują zarówno do danych, które masz przed sobą, jak i do „danych”, które masz w głowie. Możesz mieć przed sobą mundur.
shadowtalker
1
Zasadniczo Bayes nakłada na analityka większe obciążenie, ponieważ od samego początku korzysta z mózgu. Osobiście uważam, że niechęć do ustalania priorytetów jest oznaką, że albo a) jesteś zbyt leniwy, by b) nie rozumiesz, jak działają statystyki (trzeba znać jedną itd.). Powiedziałem, że trudno jest ująć ilościowo priory w mojej odpowiedzi; W praktyce nie zgadzam się z tym. Jedną rzeczą, którą zawsze możesz zrobić, to narysować krzywą dzwonka na stronie i zadać sobie pytanie „czy spodziewałbym się, że moje dane tak będą wyglądać?” Jeśli nie, zacznij dostosowywać krzywą. A jeśli nie możesz zdecydować, gdzie trzymać ten tryb, użyj hiperpriora.
shadowtalker
2
Jedno pytanie (nie powinno być bzdurne): wiesz, że istnieje literatura na temat (ilościowo) zabiegania o wcześniejsze przekonania, prawda? Łącznie z opublikowanymi przekonaniami, wywiadami eksperckimi i niespecjalistycznymi oraz przekonaniami o sobie. Powodem, dla którego pytam, jest to, że słyszałem już tę skargę, ale autorzy takich skarg uważali, że ich sprzeciw był raczej końcem dyskusji niż początkiem dochodzenia.
Alexis
1
@CliffAB Interesujące… Nie przeczytałem dogłębnie tej literatury (Bernardo, Kaas, Garthwaite… sprzed kilkudziesięciu lat)… ale jest to dla ciebie nauka obciążona wartościami: różne wcześniejsze przekonania informują, czy preferujesz metody częste, czy bayesowskie. ;)
Alexis
5

Moim skromnym zdaniem statystyki bayesowskie mają pewne wady, które są sprzeczne z ich powszechnym stosowaniem (w ChPL, ale także w innych sektorach badawczych):

  1. Trudniej jest uzyskać dane szacunkowe w porównaniu z ich częstym odpowiednikiem (najszersza część klas dotyczących statystyki przyjmuje podejście częste. Nawiasem mówiąc, interesujące byłoby zbadanie, czy jest to przyczyną, czy skutkiem ograniczonej popularności statystyki bayesowskiej ).

  2. Bardzo często statystyki bayesowskie narzucają wybory dotyczące różnych sposobów radzenia sobie z tym samym problemem (np. Który z nich jest najlepszy?), A nie tylko kliknięcia i zobaczenia (w każdym razie nie należy zachęcać do tego podejścia w ramach częstych).

  3. Statystyka bayesowska ma pewne tematy, którymi trudno zarządzać mniej niż bardzo doświadczeni statystycy (np. Niewłaściwi priory );

  4. Wymaga to analizy wrażliwości (zwykle unikanej w ramach częstych) oraz wyjątków od niektórych tematów, takich jak analiza brakujących danych.

  5. Ma tylko jedno (godne pochwały, bezpłatne oprogramowanie do pobrania) dostępne do obliczeń.

  6. To zajmuje więcej czasu , aby być samodzielnym badacz z Bayesa niż z narzędziami częstościowym.

Carlo Lazzaro
źródło
6
Dobra odpowiedź, ale nie zgadzam się z punktem 5: Mogę wymyślić wiele różnych (darmowych) programów do analizy bayesowskiej: WinBUGS, OpenBUGS, JAGS, Stan, PyMC ... i jestem pewien, że jest ich więcej. Powiedziałbym, że wszystkie te programy mają stromą krzywą uczenia się i wymagają przyzwoitej wiedzy programistycznej i statystycznej.
COOLSerdash
COOLSerdash ma rację i cieszę się zarówno z wyjaśnień, jak i komentarzy. Mój brak kompleksowości w wymienianiu oprogramowania do analizy Bayesian był prawdopodobnie spowodowany moją (luźną) znajomością tylko WinBugs.
Carlo Lazzaro,
@CarloLazzaro Zgadzam się z punktem COOLSerdash dotyczącym nr 5, a także: Począwszy od wersji 14, prywatny licencjonowany jeszcze główny pakiet statystyk Stata zawiera teraz modele Bayesa i szacunki w pakiecie waniliowym. Myślę, że dostępność obliczeniowa Bayesa wzrośnie. Ale twoje inne punkty są ważne i powinny pomóc w opracowaniu programu dla zwolenników Bayesa.
Alexis
@Alexis: będąc użytkownikiem Stata, cieszę się z jego całkiem nowego, bayesowskiego smaku. Mówiąc bardziej ogólnie, poręczyłbym za uczenie się zarówno podejść częstych, jak i bayesowskich podczas zajęć statystycznych na uniwersytecie (prawdopodobnie lamentatorzy zaczynają narzekać !!).
Carlo Lazzaro
3

Jednym z powodów jest to, że statystyki bayesowskie zostały zamrożone z głównego nurtu aż do około 1990 roku. Kiedy studiowałem statystyki w latach siedemdziesiątych, była to prawie herezja (nie wszędzie, ale w większości programów dla absolwentów). Nie pomogło to, że większość interesujących problemów była trudna do rozwiązania. W rezultacie prawie wszyscy, którzy obecnie uczą statystyki (i przeglądają artykuły do ​​czasopism oraz opracowują programy nauczania), są szkoleni jako częste osoby. Wszystko zaczęło się zmieniać około 1990 roku wraz z popularyzacją metod Markov Chain Monte Carlo (MCMC), które stopniowo trafiają do pakietów takich jak SAS i Stata. Osobiście uważam, że będą one powszechniejsze za 10 lat, chociaż w specjalistycznych aplikacjach (SPC) mogą nie mieć dużej przewagi.

Jedną z grup, która się budzi, czyni analizę bayesowską bardziej dostępną, jest grupa opracowująca pakiet STAN (mc-stan.org).

equinn1
źródło
Witamy na naszej stronie! Tylko uwaga, że ​​jest to „Stata”, a nie „STATA” - byłem na złym końcu użytkowników Stata, kiedy sam to wykorzystałem! (Myślałem, że to jak SAS, SPSS itp., Ale najwyraźniej nie ...)
Silverfish,