Jak Bayesianie porównują rozkłady?

Myślę więc, że dobrze rozumiem podstawy prawdopodobieństwa częstokroć i analizy statystycznej (i tego, jak bardzo można je wykorzystać). W świecie częstokroć sensowne jest zadawanie takiego pytania, jak: „czy ten rozkład różni się od tego rozkładu”, ponieważ zakłada się, że rozkłady są rzeczywiste, obiektywne i niezmienne (przynajmniej dla danej sytuacji), i dlatego możemy ustalić jak prawdopodobne jest, że jedna próbka jest pobierana z rozkładu w kształcie innej próbki.

W bayesowskim spojrzeniu na świat dbamy tylko o to, czego oczekujemy, biorąc pod uwagę nasze wcześniejsze doświadczenia (nadal jestem nieco niejasny w tej części, ale rozumiem koncepcję aktualizacji bayesowskiej). Jeśli tak, to jak Bayesian może powiedzieć „ten zestaw danych różni się od tego zbioru danych”?

Na potrzeby tego pytania nie dbam o istotność statystyczną ani tym podobne, tylko o to, jak obliczyć różnicę. Równie interesują mnie rozkłady parametryczne i nieparametryczne.

distributions bayesian naught101
źródło

Czy możesz wyjaśnić, co rozumiesz przez „ten zestaw danych różni się od tego zestawu danych”? Jak w przypadku, czy masz na myśli porównanie dwóch lub więcej grup, takich jak dochody mężczyzn vs. dochody kobiet? A może jak Bayesian porównuje dwie próbki dochodów bez znajomości płci?

ramhiser

@ JohnA.Ramey: Jaka jest różnica? Skoro już wszystkie liczby, czy „męskie” i „żeńskie” nie są po prostu etykietami próbek?

naught101

Odpowiedzi:

Pomyśl o swoim oświadczeniu jako Frequentist i najpierw sprecyzuj go. Frequentist nie mógł powiedzieć, że „zestaw danych A różni się od zestawu danych B”, bez dalszego wyjaśnienia.

Najpierw musisz podać, co rozumiesz przez „inny”. Być może masz na myśli „mieć różne wartości średnie”. Z drugiej strony możesz mieć na myśli „mieć różne wariancje”. A może coś innego?

Następnie musisz określić, jakiego rodzaju testu byś użył, co zależy od tego, co uważasz za słuszne założenia dotyczące danych. Czy zakładasz, że oba zestawy danych są normalnie rozmieszczone w jakiś sposób? A może uważasz, że oba są rozpowszechniane w wersji beta? Albo coś innego?

Czy widzisz teraz, że druga decyzja jest podobna do priorytetów w statystykach bayesowskich? To nie tylko „moje wcześniejsze doświadczenie”, ale raczej to, w co wierzę, a to, w co wierzę moi rówieśnicy, są rozsądnymi założeniami dotyczącymi moich danych. (A Bayesianie mogą stosować jednolite priory, co popycha sprawy do obliczeń częstych.)

EDYCJA: W odpowiedzi na twój komentarz: następny krok jest zawarty w pierwszej decyzji, o której wspomniałem. Jeśli chcesz zdecydować, czy średnie dwóch grup są różne, przyjrzyj się rozkładowi różnicy średnich dwóch grup, aby sprawdzić, czy ten rozkład zawiera zero, czy nie, na pewnym poziomie pewności. Dokładnie, jak blisko zera liczysz jako zero i dokładnie, którą część (tylnej) dystrybucji, której używasz, określasz przez ciebie i pożądany poziom pewności.

Dyskusję na temat tych pomysłów można znaleźć w artykule Kruschke , który napisał również bardzo czytelną książkę Doing Bayesian Data Analysis , która zawiera przykład na stronach 307-309 „Czy różne grupy są równe?”. (Drugie wydanie: s. 468–472.) Prowadzi także blog na ten temat , zawierający pytania i odpowiedzi.

DALSZA EDYCJA: Twój opis procesu bayesowskiego również nie jest całkiem poprawny. Bayesianie dbają tylko o to, co mówią nam dane, w świetle tego, co wiemy niezależnie od danych. (Jak zauważa Kruschke, przeor niekoniecznie musi wystąpić przed danymi. To właśnie sugeruje to wyrażenie, ale tak naprawdę to nasza wiedza wykluczająca niektóre dane). To, co wiemy niezależnie od określonego zestawu danych, może być niejasne lub specyficzne i może być oparty na konsensusie, modelu leżącym u podstaw procesu generowania danych, lub może być jedynie wynikiem innego (niekoniecznie wcześniejszego) eksperymentu.

Wayne
źródło

Tak, ok, częstokroć przyjmują rozkład, i to jest subiektywne. Ale wtedy mogą po prostu zmierzyć parametry każdej próbki z błędem i powiedzieć „ok, to są parametry prawdziwej populacji każdej próbki, a teraz jakie jest prawdopodobieństwo, że różnica wynika właśnie z błędu próbkowania”. Moje pytanie dotyczy kroku po twojej odpowiedzi - w jaki sposób Bayesian wnioskuje o różnicach między próbkami (załóżmy, że próbki pochodzą z tego samego rodzaju rozkładu, parametrycznego czy nie).

naught101

@ naught101: Proszę zobaczyć moją edycję.

Wayne

@ Wayne papier, który połączyłeś jest doskonały. Dzięki za udostępnienie

Cam.Davidson.Pilon

@ naught101: Zaktualizowałem link do bloga. Najwyraźniej zachował starsze wersje tego artykułu, a każdy z nich prowadzi do nowszego, a ten, z którym po raz pierwszy utworzyłem link, jest nieaktualny.

Wayne

Jest to całkiem fajna metoda i naprawdę wyjaśnia, jak może działać wnioskowanie bayesowskie (traktując parametry rozkładu jako źródło niepewności). Szkoda, że jest tak intensywny obliczeniowo. Ponadto użycie 95% CI wydaje się nieco zbyt podobne do ustawiania poziomu istotności, ale nie widzę, czy istnieje realny sposób na uzyskanie raportowalnego ekwiwalentu wartości p (być może suma prawdopodobieństwa wartości więcej skrajna niż 0 od średniej, dla różnicy średnich?).

naught101

ten artykuł może być interesujący: http://arxiv.org/pdf/0906.4032v1.pdf

Daje ładne podsumowanie niektórych częstych i bayesowskich podejść do problemu dwóch próbek i omawia zarówno przypadki parametryczne, jak i nieparametryczne.

Może dodać coś do innych odpowiedzi, dając prosty przykład. Załóżmy, że masz dwa zestawy danych i których każdy każdy ma wartość lub . W obu przypadkach zakłada się model Bernoulliego, więc każdy i każdy . Twój scenariusz testowania hipotez zarówno w ustawieniach częstych, jak i bayesowskich może być następujący: $\mathbf{x}$ $\mathbf{y}$ $x_i$ $y_j$ $0$ $1$ $x_i\sim Bern(p)$ $y_i\sim Bern(q)$

$\mathcal{H}_0: \: \: p=q$

niekoniecznie równe. $\mathcal{H}_1: \: \: p,q$

Prawdopodobieństwa danych w każdym przypadku są następujące:

Poniżej : $\mathcal{H}_0$ $L_0(p) = f(\mathbf{x},\mathbf{y};p) = \prod_i p^i (1-p)^{1-i} \prod_j p^j(1-p)^{1-j}$

Pod : $\mathcal{H}_1$ $L_1(p,q) = f(\mathbf{x},\mathbf{y};p,q) = \prod_i p^i (1-p)^{1-i} \prod_j q^j(1-q)^{1-j}$

(ponieważ poniżej ). Częstym podejściem do problemu może być wykonanie testu ilorazu wiarygodności, w którym obliczane są statystyki: $\mathcal{H}_0 \:\: q=p$

$W = -2\log\left\{ \frac{L_0(p_{max})}{L_1(p_{max},q_{max})}\right\},$

$p_{max},q_{max}$ $p$ $q$ $p_{max}$ $p_{max}$ $W$ $\chi^2_1$ $\mathcal{H}_0$

$p\sim \pi_0$ $\mathcal{H}_0$ $p,q\sim \pi_1$ $\mathcal{H}_1$

$BF = \frac{ f(\mathbf{x},\mathbf{y}|\mathcal{H}_0) }{f(\mathbf{x},\mathbf{y}|\mathcal{H}_1)} = \frac{ \int_0^1 L_0(p)\pi_0(p)dp}{\int_0^1 \int_0^1 L_1(p,q)\pi_1(p,q)dpdq}$

$\mathcal{H}_0$ $\mathcal{H}_1$ $\mathcal{H}_0$ $\mathcal{H}_1$ $p(\mathcal{H}_0)=p(\mathcal{H}_1) = 1/2$

$\frac{p(\mathcal{H}_0|\mathbf{x},\mathbf{y})}{p(\mathcal{H}_1|\mathbf{x},\mathbf{y})} = BF \times \frac{p(\mathcal{H}_0)}{p(\mathcal{H}_1)} = BF \times \frac{1/2}{1/2} = BF.$

$>1$ $\mathcal{H}_0$ $\mathcal{H}_1$ $\mathcal{H}_0$

$\mathcal{H}_1$

Mam nadzieję, że to pomaga wraz z innymi odpowiedziami już opublikowanymi.

Sam Livingstone
źródło

Biorąc pod uwagę dane, jak mocno naszym zdaniem 2 grupy nie pochodzą z tej samej populacji (H_1: nie pochodzą z tej samej populacji w porównaniu z H_0: pochodzą z tej samej populacji). Można to zrobić za pomocą testu t-bayesowskiego.

Złożoność służy do ustalenia, jak wiele uprzednich pokrywa się z jedną hipotezą. Dopasowanie służy do ustalenia, jak bardzo tylna pokrywa się z jedną hipotezą. W połączeniu możesz porównać hipotezy i wyrazić swoje późniejsze przekonanie, czy pochodzą one z tej samej populacji.

PascalVKooten
źródło