Niedawno zacząłem czytać „Wprowadzenie do statystyki bayesowskiej” 2. wydanie Bolstad. Miałem klasę statystyk wprowadzających, która obejmowała głównie testy statystyczne i prawie przechodzę klasę w analizie regresji. Jakich innych książek mogę użyć, aby uzupełnić moje zrozumienie tej?
Udało mi się przejść przez pierwsze 100-125 stron. Potem książka zaczyna mówić o testowaniu hipotez, co jestem bardzo podekscytowana, ale rzuca mi kilka rzeczy:
- Zastosowanie funkcji gęstości prawdopodobieństwa w obliczeniach. Innymi słowy, jak oceniać takie równania.
- To całe zdanie „Załóżmy, że korzystamy z beta (1,1) przed po zakażeniu Następnie podano y = 8, gęstość tylnej jest beta (9,3) posteriori prawdopodobieństwo hipotezy zerowej to ...”. I wierzyć beta (1,1) odnosi się do pliku PDF, w którym średnia to 1, a stdev to 1? Nie rozumiem, jak zmieniłoby się to w beta (9,3) jako funkcja gęstości tylnej.
Rozumiem pojęcie priory kontra postwale i rozumiem, jak stosować je przy użyciu stołu ręcznie. Rozumiem (myślę!), Że pi reprezentuje przypuszczalną proporcję populacji lub prawdopodobieństwo.
Nie rozumiem, jak połączyć to z danymi, na które trafiłbym na co dzień i uzyskać wyniki.
hypothesis-testing
bayesian
Justin Bozonier
źródło
źródło
Odpowiedzi:
Myślę, że nadal myślisz o tym z częstej perspektywy: jeśli szukasz oszacowania punktowego, a posterior nie da ci go. Umieszczasz pliki PDF, wyciągasz pliki PDF. Możesz uzyskać oszacowania punktowe, obliczając statystyki z twojego rozkładu tylnego, ale przejdę do tego za chwilę.
to to samo, co p ( x ) : oba są plikami PDF. π jest zwyczajowo używany do oznaczenia, że dany plik PDF ma wcześniejszą gęstość.π( x ) p (x) π
Podejrzewam, że nie dostaniesz przeorów i osób postronnych tak dobrze, jak ci się wydaje, więc cofnijmy się do fundamentalnej podstawy statystyki bayesowskiej: prawdopodobieństwa subiektywnego .
Eksperyment myślowy z prawdopodobieństwem subiektywnym
Powiedzmy, że prezentuję ci monetę i pytam, czy uważasz, że ta moneta jest uczciwa. Słyszałeś, że wiele osób mówi o nieuczciwych monetach w klasie prawdopodobieństwa, ale tak naprawdę nigdy nie widziałeś jednej w prawdziwym życiu, więc odpowiadasz: „Tak, jasne, myślę, że to uczciwa moneta”. Ale fakt, że zadaję ci to pytanie, trochę cię zniechęca, więc chociaż szacujesz, że to sprawiedliwe, nie byłbyś zaskoczony, gdyby tak nie było. O wiele mniej zaskoczony, niż gdybyś znalazł tę monetę w swojej kieszeni (ponieważ zakładasz, że to cała prawdziwa waluta, a teraz tak naprawdę mi nie ufasz, bo zachowuję się podejrzanie).
Teraz przeprowadzamy kilka eksperymentów. Po 100 rzutach moneta oddaje 53 głów. Jesteś o wiele bardziej pewny, że jest to uczciwa moneta, ale wciąż jesteś otwarty na możliwość, że tak nie jest. Różnica polega na tym, że teraz byłbyś bardzo zaskoczony, gdyby okazało się, że ta moneta ma jakieś nastawienie.
Jak możemy tutaj przedstawić twoje wcześniejsze i późniejsze przekonania, w szczególności w odniesieniu do prawdopodobieństwa, że moneta pokaże głowy (które oznaczymy )? W częstych przypadkach twoje wcześniejsze przekonanie - twoja zerowa hipoteza - wynosi θ = 0,5 . Po uruchomieniu eksperymentu nie możesz odrzucić wartości zerowej, więc kontynuujesz założenie, że tak, moneta jest prawdopodobnie sprawiedliwa. Ale w jaki sposób podsumowujemy zmianę w przekonaniu, że moneta jest uczciwa? Po eksperymencie możesz postawić zakład, że moneta jest uczciwa, ale przed eksperymentem byłbyś przerażony.θ θ =0,5
Jak wykonujemy obliczenia?
Zaczynamy od plików PDF, a kończymy na plikach PDF. Kiedy musisz zgłosić oszacowanie punktowe, możesz obliczyć statystyki, takie jak średnia, mediana lub tryb rozkładu tylnego (w zależności od funkcji utraty, do której nie będę się teraz zwracał. Pozostańmy przy średniej). Jeśli masz rozwiązanie w postaci zamkniętego formularza dla pliku PDF, określenie tych wartości prawdopodobnie będzie banalne. Jeśli tylny jest skomplikowany, możesz użyć procedur takich jak MCMC, aby pobrać próbki z tylnej i uzyskać statystyki z narysowanej próbki.
W przykładzie, w którym masz wcześniejszą wersję beta i prawdopodobieństwo dwumianowe, obliczenie tylnego zmniejsza się do bardzo czystego obliczenia. Dany:
Następnie tylny zmniejsza się do:
Stanie się tak za każdym razem, gdy będziesz mieć wcześniejszą wersję beta i prawdopodobieństwo dwumianowe, a powód powinien być widoczny w obliczeniach dostarczonych przez DJE . Kiedy określony model prawdopodobieństwa wcześniejszego zawsze daje a posteriorę, która ma taki sam rodzaj rozkładu jak wcześniejszy, związek między rodzajami rozkładów zastosowanych dla wcześniejszego a prawdopodobieństwa nazywa się koniugatem . Istnieje wiele par rozkładów, które mają powiązania sprzężone, a Bayesianie bardzo często wykorzystują sprzężenie w celu uproszczenia obliczeń. Biorąc pod uwagę szczególne prawdopodobieństwo, możesz znacznie ułatwić sobie życie, wybierając wcześniej koniugat (jeśli taki istnieje i możesz uzasadnić swój wybór przeora).
We wspólnej parametryzacji rozkładu normalnego dwa parametry oznaczają średnią i odchylenie standardowe rozkładu. Ale tak właśnie parametryzujemy rozkład normalny. Inne rozkłady prawdopodobieństwa są parametryzowane bardzo różnie.
Jak wyraźnie widać, średnia i wariancja nie są częścią parametryzacji tego rozkładu, ale mają rozwiązania w formie zamkniętej, które są prostymi funkcjami parametrów wejściowych.
źródło
Wcześniejszy beta z dwumianowym prawdopodobieństwem (stała liczba prób z wynikami binarnymi i ustalonymi prawdopodobieństwami sukcesu / porażki) ma właściwość sprzężenia, która pozwala na napisanie w późniejszym czasie (iloczynu wcześniejszego i prawdopodobieństwa) w formie zamkniętej:
For the particular example in the text, the author is indicating that a beta(1,1) prior with data n=10 and y=8 produces a beta(1+8,1+2)=beta(9,3) posterior distribution onθ .
This closed-form expression is convenient, but by no means necessary. Multiplying probability densities can be done the same way as multiplying other mathematical expressions; the difficulties arrive since many products of densities are not as easily rewritten as the beta prior/binomial likelihood. Fortunately, this is where computers pick up the slack.
źródło
Jeśli szukasz delikatniejszego podejścia, gorąco polecam książkę Kruschke która używa R do wyjaśnienia podstawowych pojęć. Jest to bardzo praktyczne i praktyczne podejście do nauki statystyki bayesowskiej, a na jego stronie można znaleźć wszystkie użyte kody.
Ktoś mi też polecił tekst Cam.Davidson.Pilon, nie oglądałem go jeszcze, ale można go znaleźć tutaj .
źródło