Dlaczego statystyki bayesowskie stają się coraz popularniejszym tematem badań? [Zamknięte]

10

Przeglądając obszar badań 100 najpopularniejszego programu statystycznego US News, prawie wszystkie z nich są ciężkie w statystykach bayesowskich. Jeśli jednak pójdę do szkoły niższego szczebla, większość z nich nadal prowadzi badania nad klasycznymi / częstymi statystykami. Na przykład, moja obecna szkoła (od 150 do 200 w światowym rankingu QS dla statystyk, więc nie uważana za szkołę najwyższego poziomu) ma tylko jednego profesora skupiającego się na statystykach bayesowskich i prawie nie ma urazy do statystyk bayesowskich. Niektórzy studenci, z którymi rozmawiałem, mówią nawet, że statystyki bayesowskie robią statystyki bayesowskie ze względu na to, co oczywiście zdecydowanie się nie zgadzam.

Zastanawiam się jednak, dlaczego tak jest. Mam kilka wykształconych przypuszczeń:

(a) nie ma wystarczająco dużo miejsca na postępy w metodyce statystyk klasycznych / częstych, a jedynym realnym badaniem w statystykach klasycznych / częstych są aplikacje, które będą w centrum uwagi szkół niższego poziomu, ponieważ szkoła najwyższego poziomu powinna być bardziej skłonny do badań teoretycznych i metodologicznych.

(b) W dużym stopniu zależy od pola. Pewna gałąź statystyk jest po prostu bardziej odpowiednia dla statystyk bayesowskich, takich jak wiele naukowych zastosowań metody statystycznej, podczas gdy inna gałąź jest bardziej odpowiednia dla klasycznych statystyk, takich jak obszar finansowy. (popraw mnie, jeśli się mylę) Biorąc to pod uwagę, wydaje mi się, że szkoły najwyższego poziomu mają wiele wydziałów statystyki wykonujących aplikacje w dziedzinie nauki, podczas gdy dział statystyk szkół niższego poziomu koncentruje głównie aplikacje w obszarze finansowym, ponieważ pomaga im to generować dochód i finansowanie.

(c) Istnieją ogromne problemy z metodą częstych, których nie można rozwiązać, na przykład podatność na nadmierne dopasowanie MLE itp. A Bayesian wydaje się zapewniać genialne rozwiązania.

(d) Potęga obliczeniowa jest tutaj, dlatego obliczenia bayesowskie nie są już wąskim gardłem, jak miało to miejsce 30 lat temu.

(e) To może być najbardziej uparta opinia, jaką mam. Istnieje opór ze strony statystyk klasycznych / częstych, którzy po prostu nie lubią nowej fali metodologii, która może potencjalnie przejąć rolę klasycznych statystyk. Ale jak powiedział Larry Wasserman, zależy to od tego, co próbujemy zrobić i każdy powinien zachować otwarty umysł, szczególnie jako badacz.

Davidolohowski
źródło
1
Chociaż opinie mieszkańców CV będą się różnić, a taka opinia jest uważana za nie na temat, warto zauważyć, że dokładnie na to pytanie odpowiedziano we wstępnych rozdziałach współczesnych tekstów na temat analizy bayesowskiej. W szczególności rozdział 1 Gelman i wsp. Bayesian Data Analysis 3rd Ed. Sprowadza się to do a) „zdrowego rozsądku” ib) wysoce problematycznego częstego przedziału ufności wśród częstych, którego 99% z nas nie może nie zrozumieć. Sposób, w jaki źle go interpretujemy, jest wewnętrznie bayesowski, więc równie dobrze moglibyśmy przeprowadzić analizę bayesowską od samego początku.
Peter Leopold
3
@Peter Leopold Half poważnie: 99%? a kim jest „my”? Wielu naiwnych użytkowników statystyk rzeczywiście ma poważne nieporozumienia na temat CI, ale jeśli zwracasz się do społeczności CV, mam nadzieję, że 99% naprawdę nie pasuje. Statystyczni ludzie mogą być tak samo źli jak inni w tworzeniu liczb przy braku twardych danych!
Nick Cox,
@NickCox Mówiłem do OP, a „my” ma być empatyczny i sprzyjający włączeniu społecznemu. Mamy nadzieję, że „99%” jest uznawane za szacunek rzędu wielkości10-2). Jest to także większy ułamek tropu „ nie mam / nie mam” w kulturze popularnej, gdzie „brak” w tym kontekście wskazuje na wydarzenie: „Wziąłem statystyki 101, ale nie w pełni zinternalizowałem częstą vs. bayesowską interpretację przedziałów ufności a wiarygodne interwały ”. A teraz, kiedy mnie wezwałeś, zapewniam (: D), że to mój oficjalny przeor na to wydarzenie! Oczywiście jestem gotów przekonać się inaczej! : D
Peter Leopold

Odpowiedzi:

8

Osobiście zaryzykowałbym kilka domysłów:

(1) Statystyki bayesowskie odnotowały ogromny wzrost popularności w ciągu ostatnich kilku dekad. Częściowo było to spowodowane postępami w MCMC i ulepszeniami zasobów obliczeniowych. Statystyki bayesowskie przeszły od teoretycznie naprawdę ładnego, ale mającego zastosowanie tylko do problemów z zabawkami, do podejścia, które można by zastosować bardziej uniwersalnie. Oznacza to, że kilka lat temu powiedzenie, że pracowałeś nad statystykami bayesowskimi, prawdopodobnie sprawiło, że stałeś się bardzo konkurencyjnym zatrudnieniem.

Powiedziałbym, że statystyki bayesowskie wciąż stanowią plus, ale pracują nad interesującymi problemami bez użycia metod bayesowskich. Brak tła w statystyce Bayesa pewnością byłaby minus do większości komitetów zatrudniania, ale coraz doktora w statystykach bez wystarczającego treningu metod Bayesa byłoby dość zaskakujące.

(2) Statystycy bayesowscy wspominają w swoim CV „bayesian”. Częstokroć zwykle nie umieszczają „Częstotliwości” w swoim CV, ale znacznie częściej obszar, w którym pracują (tj. Analiza przeżycia, modelowanie predykcyjne, prognozowanie itp.). Jako przykład, duża część mojej pracy polega na pisaniu algorytmów optymalizacyjnych, co, jak sądzę, sugeruje, że oznacza to, że wykonuję pracę z częstotliwością. Napisałem też sporo algorytmów bayesowskich, ale na pewno jest to niewielka część mojej pracy. Statystyki bayesowskie dotyczą mojego CV, statystyki częstych nie.

(3) Do pewnego stopnia to, co powiedziałeś w swoim pytaniu, również zawiera prawdę. Skuteczne ogólne obliczenia bayesowskie mają w sobie więcej otwartych problemów niż dziedzina Frequentist. Na przykład Hamiltonian Monte Carlo stał się ostatnio bardzo ekscytującym algorytmem do ogólnego próbkowania z modeli bayesowskich. Nie ma wiele miejsca na ulepszenie generycznychoptymalizacja w tych dniach; Algorytmy Newtona Raphsona, L-BFGS i EM obejmują wiele zasad. Jeśli chcesz ulepszyć te metody, zazwyczaj musisz dużo specjalizować się w tym problemie. W związku z tym bardziej lubisz mówić: „Pracuję nad wielowymiarową optymalizacją modeli geoprzestrzennych”, a nie „Pracuję nad wielowymiarowymi szacunkami maksymalnego prawdopodobieństwa”. Świat uczenia maszynowego stanowi tutaj wyjątek, ponieważ ekscytuje się odkrywaniem nowych metod optymalizacji stochastycznej (np. SGD, Adam itp.), Ale z kilku powodów jest to nieco inna bestia.

Podobnie, jest wiele do zrobienia, aby wymyślić dobre priorytety dla modeli. Metody częstościowym zrobić mieć odpowiednik tego (wymyślanie dobrych kar, czyli Lasso glmnet), ale nie ma chyba bardziej podatny grunt dla priors ponad kar.

(4) Wreszcie i jest to zdecydowanie bardziej osobista opinia, wiele osób kojarzy Frequentist z wartościami p. Biorąc pod uwagę ogólne niewłaściwe wykorzystanie wartości p obserwowane w innych dziedzinach, wielu statystów chętnie zdystansuje się jak najdalej od aktualnych niewłaściwych zastosowań wartości p.

Cliff AB
źródło
3
Zatem odpowiedź na pytanie, dlaczego stała się bardziej popularna, obejmuje (1), że stała się bardziej popularna. Zastanawia mnie to, ale wyobrażam sobie, że to tylko kwestia przeredagowania.
Nick Cox,
@NickCox: Chodzi mi o to, że jest bardziej popularny, ale jego popularność może być nieco zawyżona. Oznacza to, że PO widział, że statystyki bayesowskie widniały na życiorysie prawie każdego profesora na próbce uniwersytetów najwyższego poziomu. Ale to nie znaczy, że każdy z tych profesorów robi tylko statystyki bayesowskie. Innym punktem na (1) było to, że myślę, że był czas, kiedy robiłem statystyki bayesowskie, ponieważ twój obszar badawczy był bardzo ważny dla uzyskania pozycji najwyższego poziomu. Nie jestem pewien, czy jest to już tak rygorystyczne, ale wielu profesorów, których widzisz teraz, zostało zatrudnionych w tym czasie.
Cliff AB
Och, rozumiem twój punkt widzenia. Skupiłem się na dyskusji na temat „Czy to dlatego, że nie ma wystarczająco dużo miejsca na postęp w statystyce klasycznej / częstej?” i nie tyle na temat „dlaczego tak się dzieje?”
Cliff AB