Paradoks danych ID (przynajmniej dla mnie)

24

Jeśli chodzi o moją kruszywa (i ograniczonych) wiedzy na statystykach zezwoleń, zrozumiałem, że jeśli X1,X2,...,Xn są IID zmiennymi losowymi, a następnie jako termin oznacza, że są niezależne i jednakowo rozdzielone.

Moje obawy o to dawny majątek próbek IID, który brzmi:

p(Xn|Xi1,Xi2,...,Xik)=p(Xn),

dla dowolnej kolekcji różnych 's st 1 i j < n .ij1ij<n

Jednak wiadomo, że suma niezależnych próbek identycznych rozkładów dostarcza informacji o strukturze rozkładu, aw rezultacie o w powyższym przypadku, więc tak naprawdę nie powinno być tak, że: p ( X n | X i 1 , X i 2 , . . . , X i K ) = P ( x n ) .Xn

p(Xn|Xi1,Xi2,...,Xik)=p(Xn).

Wiem, że jestem ofiarą błędu, ale nie wiem dlaczego. Proszę, pomóż mi w tym.

Cupitor
źródło
Czy wiesz, że rządzi Bayes? Słyszałem o klasykach. vs statystyki bayesowskie? Dawcy?
Matthew Gunn,
1
Nie podążam za argumentem na końcu twojego pytania. Czy możesz być bardziej wyraźny?
Glen_b
@Glen_b czego dokładnie nie przestrzegasz? Co masz na myśli pod koniec? Staram się powiedzieć z różnymi logikami, że zarówno równość, jak i nierówność wydają się prawdopodobne, co jest paradoksem.
Cupitor
Nie ma tu paradoksu - po prostu brak zastosowania odpowiednich definicji. Nie możesz twierdzić, że masz paradoks, gdy ignorujesz znaczenie używanych słów! W tym przypadku porównanie definicji niezależnie do tego z prawdopodobieństwem pokaże błąd.
whuber
@ Whuber, zakładam, że zauważyłeś wyraźne „(przynajmniej dla mnie)” w tytule mojego pytania, a także fakt, że proszę o pomoc w znalezieniu „błędności” mojego argumentu, co wskazuje na fakt, że to naprawdę nie jest prawdziwym paradoksem.
Cupitor

Odpowiedzi:

30

(1)P(Xn|θ,Xi1,Xi2,,Xik)=P(Xn|θ)
Xnθ), wówczas rozkład nie zmienia się, biorąc pod uwagę, że zaobserwowałeś z niego kilka próbek.

XnnθXnn(1)

P(θ|Xn)P(θ|Xi1,Xi2,,Xik)

Sobi
źródło
Dziękuję Ci bardzo. Całkiem do rzeczy. Całkiem zabawne, że zgadywałem taką odpowiedź jakiś czas temu, ale o tym zapomniałem ... O ile rozumiem, błędem jest niejawne zakładanie „modelu”, który może sparametryzować rozkład zmiennej losowej. Czy dobrze to zrozumiałem?
Cupitor
1
@Cupitor: Cieszę się, że było to przydatne. Tak, zależne od modelu, niezależne zmienne losowe nie wpływają na siebie. Ale, jak prawdopodobne jest, że dany rozkład wygenerował sekwencję zmian wyników, gdy widzisz więcej próbek z podstawowego (prawdziwego) rozkładu (niezależnie od założenia niezależności).
Sobi,
15

XθP(XnXn1,X1,θ)=P(Xnθ)

θθθ

Xnθ

Statystyki bayesowskie a klasyczne

xi

  • P(xi=H)θθ
  • θ

θθ

Dokąd to zmierza?

n

P(xn=Hxn1,xn2,,x1)=P(xn=H)=θ
θ

Bayesian głęboko w subiektywnym prawdopodobieństwie powiedziałby, że liczy się prawdopodobieństwo z jej perspektywy! . Jeśli zobaczy 10 głów z rzędu, 11. głowa jest bardziej prawdopodobne, ponieważ 10 głów z rzędu prowadzi do przekonania, że ​​moneta jest przekrzywiona na korzyść głów.

P(x11=Hx10=H,x9=H,,x1=H)>P(x1=H)

θθθ

P(x11=Hx10=H,x9=H,,x1=H,θ)=P(x1=Hθ)=θ

θθ

Dalsze uwagi

Starałem się dać krótkie wprowadzenie tutaj, ale to, co zrobiłem, jest w najlepszym razie dość powierzchowne, a koncepcje są w pewnym sensie dość głębokie. Jeśli chcesz zagłębić się w filozofię prawdopodobieństwa, książka Savage'a z 1954 r., Foundation of Statistics to klasyk. Google dla Bayesian vs. Frequist i pojawi się mnóstwo rzeczy.

Innym sposobem myślenia o losowaniach IID jest twierdzenie de Finetti i pojęcie wymienności . W ramach bayesowskich wymienność jest równoważna niezależności zależnej od pewnej utajonej zmiennej losowej (w tym przypadku krzywej monety).

Matthew Gunn
źródło
Zasadniczo podejście bayesowskie traktowałoby stwierdzenie „iid zmiennych losowych” nie jako aksjomat, że muszą one być IID, ale tak samo jak bardzo mocne wcześniejsze założenie, że tak jest - i jeśli nawet mocniejsze dowody wskazują, że jest bardzo mało prawdopodobne, aby dane założenia są prawdziwe, to „niedowierzanie w danych warunkach” znajdzie odzwierciedlenie w wynikach.
Peteris,
Dziękuję bardzo za dokładną odpowiedź. Poparłem go, ale myślę, że odpowiedź Sobi bardziej wyraźnie wskazuje, na czym polega problem, tj. Domyślnie zakłada strukturę modelu (lub jest to, o ile ją rozumiem)
Cupitor
1
@Matthew Gunn: schludny, dokładny i bardzo dobrze wyjaśniony! Nauczyłem się kilku rzeczy z twojej odpowiedzi, dzięki!
Sobi