Przeglądając obszar badań 100 najpopularniejszego programu statystycznego US News, prawie wszystkie z nich są ciężkie w statystykach bayesowskich. Jeśli jednak pójdę do szkoły niższego szczebla, większość z nich nadal prowadzi badania nad klasycznymi / częstymi statystykami. Na przykład, moja obecna szkoła (od 150 do 200 w światowym rankingu QS dla statystyk, więc nie uważana za szkołę najwyższego poziomu) ma tylko jednego profesora skupiającego się na statystykach bayesowskich i prawie nie ma urazy do statystyk bayesowskich. Niektórzy studenci, z którymi rozmawiałem, mówią nawet, że statystyki bayesowskie robią statystyki bayesowskie ze względu na to, co oczywiście zdecydowanie się nie zgadzam.
Zastanawiam się jednak, dlaczego tak jest. Mam kilka wykształconych przypuszczeń:
(a) nie ma wystarczająco dużo miejsca na postępy w metodyce statystyk klasycznych / częstych, a jedynym realnym badaniem w statystykach klasycznych / częstych są aplikacje, które będą w centrum uwagi szkół niższego poziomu, ponieważ szkoła najwyższego poziomu powinna być bardziej skłonny do badań teoretycznych i metodologicznych.
(b) W dużym stopniu zależy od pola. Pewna gałąź statystyk jest po prostu bardziej odpowiednia dla statystyk bayesowskich, takich jak wiele naukowych zastosowań metody statystycznej, podczas gdy inna gałąź jest bardziej odpowiednia dla klasycznych statystyk, takich jak obszar finansowy. (popraw mnie, jeśli się mylę) Biorąc to pod uwagę, wydaje mi się, że szkoły najwyższego poziomu mają wiele wydziałów statystyki wykonujących aplikacje w dziedzinie nauki, podczas gdy dział statystyk szkół niższego poziomu koncentruje głównie aplikacje w obszarze finansowym, ponieważ pomaga im to generować dochód i finansowanie.
(c) Istnieją ogromne problemy z metodą częstych, których nie można rozwiązać, na przykład podatność na nadmierne dopasowanie MLE itp. A Bayesian wydaje się zapewniać genialne rozwiązania.
(d) Potęga obliczeniowa jest tutaj, dlatego obliczenia bayesowskie nie są już wąskim gardłem, jak miało to miejsce 30 lat temu.
(e) To może być najbardziej uparta opinia, jaką mam. Istnieje opór ze strony statystyk klasycznych / częstych, którzy po prostu nie lubią nowej fali metodologii, która może potencjalnie przejąć rolę klasycznych statystyk. Ale jak powiedział Larry Wasserman, zależy to od tego, co próbujemy zrobić i każdy powinien zachować otwarty umysł, szczególnie jako badacz.
źródło
Odpowiedzi:
Osobiście zaryzykowałbym kilka domysłów:
(1) Statystyki bayesowskie odnotowały ogromny wzrost popularności w ciągu ostatnich kilku dekad. Częściowo było to spowodowane postępami w MCMC i ulepszeniami zasobów obliczeniowych. Statystyki bayesowskie przeszły od teoretycznie naprawdę ładnego, ale mającego zastosowanie tylko do problemów z zabawkami, do podejścia, które można by zastosować bardziej uniwersalnie. Oznacza to, że kilka lat temu powiedzenie, że pracowałeś nad statystykami bayesowskimi, prawdopodobnie sprawiło, że stałeś się bardzo konkurencyjnym zatrudnieniem.
Powiedziałbym, że statystyki bayesowskie wciąż stanowią plus, ale pracują nad interesującymi problemami bez użycia metod bayesowskich. Brak tła w statystyce Bayesa pewnością byłaby minus do większości komitetów zatrudniania, ale coraz doktora w statystykach bez wystarczającego treningu metod Bayesa byłoby dość zaskakujące.
(2) Statystycy bayesowscy wspominają w swoim CV „bayesian”. Częstokroć zwykle nie umieszczają „Częstotliwości” w swoim CV, ale znacznie częściej obszar, w którym pracują (tj. Analiza przeżycia, modelowanie predykcyjne, prognozowanie itp.). Jako przykład, duża część mojej pracy polega na pisaniu algorytmów optymalizacyjnych, co, jak sądzę, sugeruje, że oznacza to, że wykonuję pracę z częstotliwością. Napisałem też sporo algorytmów bayesowskich, ale na pewno jest to niewielka część mojej pracy. Statystyki bayesowskie dotyczą mojego CV, statystyki częstych nie.
(3) Do pewnego stopnia to, co powiedziałeś w swoim pytaniu, również zawiera prawdę. Skuteczne ogólne obliczenia bayesowskie mają w sobie więcej otwartych problemów niż dziedzina Frequentist. Na przykład Hamiltonian Monte Carlo stał się ostatnio bardzo ekscytującym algorytmem do ogólnego próbkowania z modeli bayesowskich. Nie ma wiele miejsca na ulepszenie generycznychoptymalizacja w tych dniach; Algorytmy Newtona Raphsona, L-BFGS i EM obejmują wiele zasad. Jeśli chcesz ulepszyć te metody, zazwyczaj musisz dużo specjalizować się w tym problemie. W związku z tym bardziej lubisz mówić: „Pracuję nad wielowymiarową optymalizacją modeli geoprzestrzennych”, a nie „Pracuję nad wielowymiarowymi szacunkami maksymalnego prawdopodobieństwa”. Świat uczenia maszynowego stanowi tutaj wyjątek, ponieważ ekscytuje się odkrywaniem nowych metod optymalizacji stochastycznej (np. SGD, Adam itp.), Ale z kilku powodów jest to nieco inna bestia.
Podobnie, jest wiele do zrobienia, aby wymyślić dobre priorytety dla modeli. Metody częstościowym zrobić mieć odpowiednik tego (wymyślanie dobrych kar, czyli Lasso glmnet), ale nie ma chyba bardziej podatny grunt dla priors ponad kar.
(4) Wreszcie i jest to zdecydowanie bardziej osobista opinia, wiele osób kojarzy Frequentist z wartościami p. Biorąc pod uwagę ogólne niewłaściwe wykorzystanie wartości p obserwowane w innych dziedzinach, wielu statystów chętnie zdystansuje się jak najdalej od aktualnych niewłaściwych zastosowań wartości p.
źródło