Częstochowskie rozumowanie i uwarunkowania na podstawie obserwacji (przykład Wagenmakers i in.)

9

Nie jestem ekspertem w dziedzinie statystyki, ale zdaję sobie sprawę, że istnieje spór, czy „częstokształtna” czy „bayesowska” interpretacja prawdopodobieństwa jest „słuszna”. Od Wagenmakers i in. al p. 183:

Rozważ równomierny rozkład ze średnią i szerokością . Narysuj dwie wartości losowo z tej dystrybucji, etykieta najmniejszy oraz największy , i sprawdzić, czy średnimi kłamstwa pomiędzy i . Jeśli procedurę tę powtarza się bardzo wiele razy, średnie będzie leżeć między i w połowie przypadków. Zatem podaje 50% częstość przedziału ufności dla . Ale załóżmy, że dla danego losowania, iμ1slμslμsl(s,l)μs=9.8l=10.7. Różnica między tymi wartościami wynosi , co obejmuje 9/10 zakresu rozkładu. Stąd, dla tych konkretnych wartości i możemy być w 100% pewni, że , nawet jeśli częsty przedział ufności sprawi, że uważasz, że powinieneś mieć tylko 50% pewności.0.9sls<μ<l

Czy naprawdę są ludzie, którzy wierzą, że w tej sprawie jest tylko 50% pewności, czy jest to słaby człowiek?

Wydaje mi się, że bardziej ogólnie książka wydaje się mówić, że częstokroć nie może wyrazić twierdzenia warunkowego, takiego jak: „Biorąc pod uwagę i , z prawdopodobieństwem 1”. Czy to prawda, że ​​uwarunkowanie sugeruje bayesowskie rozumowanie?s=9.8l=10.7s<μ<l

Xodarap
źródło
8
Wszystkie trzy obecne odpowiedzi są bardzo dobre. Dodałbym tylko, że Wagenmakers wysuwa argument słownie w tym sensie, że żaden statystyczny statystyk nigdy nie zaleciłby tego przedziału ufności - istnieje on w literaturze jedynie jako przykład patologicznego przedziału ufności. Z częstokroć wynika, że ​​sam zasięg zaufania nie jest wystarczający do dobrego wnioskowania. (Jestem Bayesian.)
Cyan

Odpowiedzi:

14

W grę wchodzi skomplikowane oszukiwanie. Przedział ufności nie wykorzystuje informacji, że zakres munduru wynosi 1, a zatem jest nieparametryczny, podczas gdy twierdzenie dotyczące próbki o wartości tak, i jest wysoce zależne od modelu. Jestem pewien, że można poprawić zasięg lub (oczekiwaną) długość przedziału ufności, jeśli weźmie się pod uwagę te informacje. Po pierwsze, punkty końcowe rozkładu znajdują się co najwyżej od lub . Stąd 100% przedział ufności dla wynosi .(s,l)ls=0.91(ls)slμ(l1/2,s+1/2)

Ten szczególny problem wchodzi w zakres wnioskowania dla częściowo zidentyfikowanych rozkładów badanych w ciągu ostatnich 10-15 lat w zakresie ekonometrii teoretycznej. Prawdopodobieństwo, a zatem i bayesowskie, wnioskowanie o rozkładzie jednolitym jest brzydkie, ponieważ stanowi nieregularny problem (obsługa rozkładu zależy od nieznanego parametru).

StasK
źródło
Wątpię, czy możesz obniżyć oczekiwaną długość poniżej dla 50% przedziału ufności na próbce 2 elementów. 13
Henry
11

Waham się odpowiedzieć na to pytanie. Te częstościowe kontra bayesowskie sprzeczki są generalnie bezproduktywne i mogą być nieprzyjemne i nieletnie. Jeśli chodzi o to, co jest warte, Wagenmakers to coś wielkiego, podczas gdy z drugiej strony w dużej mierze zapomnieli chińscy filozofowie w wieku ponad 3 000 lat ...

Argumentowałbym jednak, że standardowa interpretacja 50% przedziału ufności dla Frequentist nie polega na tym, że powinieneś być w 50% pewien, że prawdziwa wartość mieści się w przedziale, lub że istnieje 50% prawdopodobieństwo, że to zrobi. Chodzi raczej o to, że gdyby ten sam proces był powtarzany w nieskończoność, procent CI, który zawierałby prawdziwą wartość, zbliżyłby się do 50%. Jednak dla każdego pojedynczego przedziału prawdopodobieństwo, że zawiera on prawdziwą wartość, wynosi 0 lub 1, ale nie wiesz, który .

gung - Przywróć Monikę
źródło
5

Myślę, że to słaby argument za mocnym argumentem.

(s,l) może być 50% przedziałem ufności w zdefiniowanym sensie, ale też i myślę, że to ostatnie może być uzasadnione jako lepsze w tych okolicznościach, ponieważ rozciąga się bez dalszej korekty na większe próbki; zauważ również, że ten ostatni przedział ufności nigdy nie jest szerszy niż a jego oczekiwana szerokość dla próbki o rozmiarze wynosi .(3l+s14,3s+l+14)12n1n+1

Henz
źródło
W przytoczonym przykładzie próbki moja sugerowana alternatywa dałaby przedział ufności , który jest wyraźnie środkową połową logicznego przedziału ufności{9.8,10.7}50%[10.225,10.275]100%[10.2,10.3]
Henry,