Chciałbym znaleźć kilka „prawdziwych przykładów” do nauczania statystyki bayesowskiej. Statystyka bayesowska pozwala formalnie włączyć wcześniejszą wiedzę do analizy. Chciałbym podać uczniom proste przykłady badaczy z prawdziwego świata, którzy uwzględniają wcześniejszą wiedzę w swoich analizach, aby studenci mogli lepiej zrozumieć motywację, dla której można chcieć przede wszystkim wykorzystywać statystyki bayesowskie.
Czy znasz jakieś proste przykłady ze świata rzeczywistego, takie jak szacowanie średniej populacji, proporcji, regresji itp., W których badacze formalnie uwzględniają wcześniejsze informacje? Zdaję sobie sprawę, że Bayesianie mogą również wykorzystywać „nieinformacyjne” priory, ale szczególnie interesują mnie prawdziwe przykłady, w których wykorzystuje się informacyjne priory (tj. Prawdziwe wcześniejsze informacje).
Odpowiedzi:
Bayesowska teoria wyszukiwania jest interesującą aplikacją statystyki bayesowskiej w świecie rzeczywistym, która była wielokrotnie stosowana do wyszukiwania zaginionych statków na morzu. Na początek mapa jest podzielona na kwadraty. Każdemu kwadratowi przypisuje się wcześniejsze prawdopodobieństwo zatrzymania zagubionego statku, w oparciu o ostatnią znaną pozycję, kurs, brakujący czas, prądy itp. Dodatkowo każdemu kwadratowi przypisane jest warunkowe prawdopodobieństwo znalezienia statku, jeśli faktycznie znajduje się w tym kwadracie, na podstawie rzeczy takie jak głębokość wody. Rozkłady te są łączone w celu ustalenia priorytetów kwadratów mapy, które mają największe prawdopodobieństwo uzyskania pozytywnego wyniku - niekoniecznie jest to najbardziej prawdopodobne miejsce dla statku, ale najbardziej prawdopodobne miejsce faktycznego znalezienia statku.
źródło
Myślę, że oszacowanie wielkości produkcji lub populacji na podstawie numerów seryjnych jest interesujące, jeśli tradycyjny przykład wyjaśniający. Tutaj próbujesz maksimum dyskretnego równomiernego rozkładu. W zależności od wcześniejszego wyboru maksymalne prawdopodobieństwo i szacunki Bayesa będą się różnić w dość przejrzysty sposób.
Być może najbardziej znanym przykładem jest szacowanie wydajności produkcji niemieckich czołgów podczas drugiej wojny światowej na podstawie pasm numerów seryjnych czołgów i kodów producenta wykonanych w ustawieniach częstych przez (Ruggles i Brodie, 1947). Alternatywna analiza z punktu widzenia bayesowskiego z pouczającymi priors została wykonana przez (Downey, 2013), a z niewłaściwymi, pozbawionymi informacji priorsami przez (Höhle i Held, 2004). Praca (Höhle i Held, 2004) zawiera także wiele innych odniesień do wcześniejszego leczenia w literaturze, a także więcej dyskusji na temat tego problemu na tej stronie.
Źródła:
Rozdział 3, Downey, Allen. Pomyśl Bayes: statystyki bayesowskie w Pythonie. „O'Reilly Media, Inc.”, 2013.
Wikipedia
Ruggles, R .; Brodie, H. (1947). „Empiryczne podejście do wywiadu gospodarczego w czasie II wojny światowej”. Journal of American Statistics Association. 42 (237): 72.
Höhle, Michael i Leonhard Held. Bayesowskie oszacowanie wielkości populacji. Nr 499. Dokument do dyskusji // Sonderforschungsbereich 386 der Ludwig-Maximilians-Universität München, 2006.
źródło
W Cressie & Wickle Statistics for Spatio-Temporal Data , Wiley jest ładna historia o (bayesowskim) poszukiwaniu USS Scorpion, łodzi podwodnej zaginionej w 1968 roku. Opowiadamy tę historię naszym studentom i każemy im wykonać ( uproszczone) wyszukiwanie za pomocą symulatora .
Podobne przykłady można zbudować wokół historii zagubionego lotu MH370; możesz spojrzeć na Davey i wsp., Bayesian Methods in the Search for MH370 , Springer-Verlag.
źródło
Oto przykład oszacowania średniej podstawie normalnych danych ciągłych. Zanim przejdę bezpośrednio do przykładu, chciałbym przejrzeć niektóre obliczenia matematyczne dla normalnych i normalnych modeli Bayesa.θ
Rozważ losową próbkę n ciągłych wartości oznaczonych przez . Tutaj wektor reprezentuje zebrane dane. Model prawdopodobieństwa dla danych normalnych o znanej wariancji i niezależnych i identycznie rozmieszczonych (iid) próbkach to r = ( Y 1 , . . . , Y n ) Ty1, . . . , yn y= ( y1, . . . , yn)T.
Lub, jak zwykle pisze Bayesian,
Rozkład tylny uzyskany z tego modelu danych Normalny-Normalny (po dużej algebrze) jest kolejnym rozkładem Normalnym.
To powiedziawszy, możesz teraz użyć dowolnego podręcznika z danymi normalnymi, aby to zilustrować. Wykorzystam zestaw danych
airquality
w R. Rozważmy problem szacowania średnich prędkości wiatru (MPH).W tej analizie badacz (ty) może powiedzieć, że biorąc pod uwagę dane + wcześniejsze informacje, twój szacunkowy średni wiatr, używając 50 percentyla, prędkości powinny wynosić 10,00324, więcej niż po prostu używając średniej z danych. Uzyskujesz również pełny rozkład, z którego możesz wydobyć 95% wiarygodny przedział przy użyciu kwantyli 2,5 i 97,5.
Poniżej zamieszczam dwa odniesienia, gorąco polecam przeczytanie krótkiego artykułu Caselli. Jest specjalnie ukierunkowany na empiryczne metody Bayesa, ale wyjaśnia ogólną metodologię Bayesa dla modeli normalnych.
Bibliografia:
Casella, G. (1985). Wprowadzenie do empirycznej analizy danych Bayesa. The American Statistician, 39 (2), 83-87.
Gelman, A. (2004). Analiza danych bayesowskich (wydanie 2, Teksty w statystyce). Boca Raton, Fla .: Chapman & Hall / CRC.
źródło
Obszarem badań, w którym uważam, że metody bayesowskie są absolutnie konieczne, jest optymalny projekt.
źródło
Ostatnio myślałem o tym pytaniu i wydaje mi się, że mam przykład, w którym bayesowski ma sens, z wykorzystaniem wcześniejszego prawdopodobieństwa: współczynnika prawdopodobieństwa testu klinicznego.
Przykładem może być ten: ważność spadania moczu w codziennych warunkach praktyki (Family Practice 2003; 20: 410-2). Chodzi o to, aby zobaczyć, co pozytywny wynik zanurzenia moczu wpływa na diagnostykę infekcji moczu. Wskaźnik prawdopodobieństwa wyniku dodatniego wynosi:
Tutaj test jest dobry do wykrycia infekcji, ale nie tak dobry do odrzucenia infekcji.
źródło