Mamy N próbek, , z jednolitego rozkładu [0, \ theta], gdzie \ theta jest nieznany. Oszacuj \ theta na podstawie danych.
Tak więc zasada Bayesa ...
a prawdopodobieństwo wynosi:
(edytuj: kiedy dla wszystkich , a 0 w przeciwnym razie - dzięki whuber)
ale bez żadnych innych informacji o , wydaje się, że przeor powinien być proporcjonalny do (tj. jednolity) lub do (Jeffreys Prior?) w ale wtedy moje całki nie nie są zbieżne i nie jestem pewien, jak postępować. Jakieś pomysły?
Odpowiedzi:
Wywołało to interesującą debatę, ale zauważ, że tak naprawdę nie ma to większego znaczenia w kwestii zainteresowania. Osobiście uważam, że ponieważ jest parametrem skali, argument grupy transformacji jest odpowiedni, co prowadzi do wcześniejszegoθ
Rozkład ten ma tę samą formę przy zmianie skali problemu (prawdopodobieństwo również pozostaje „niezmienne” przy zmianie skali). Jądro tego przedniego, można uzyskać, rozwiązując równanie funkcjonalne . Wartości zależą od problemu i naprawdę mają znaczenie tylko wtedy, gdy wielkość próbki jest bardzo mała (jak 1 lub 2). Tylne to ścięte pareto, podane przez:f(y)=y−1 af(ay)=f(y) L,U
Ale teraz załóżmy, że używamy bardziej ogólnego przeora, podanego przez (zwróć uwagę, że utrzymujemy granice aby upewnić się, że wszystko jest w porządku - nie ma wtedy pojedynczej matematyki ). Tylny jest wtedy taki sam jak powyżej, ale z zastąpiony przez - pod warunkiem, że . Powtarzając powyższe obliczenia, mamy uproszczoną średnią tylnąp(θ|cI)∝θ−c−1 L,U N c+N c+N≥0
Zatem jednolity przed ( ) da oszacowanie pod warunkiem, że (średnia jest nieskończona dla ). To pokazuje, że tutaj debata przypomina trochę, czy użyć czy jako dzielnika w oszacowaniu wariancji.c=−1 N−1N−2X(N) N≥2 N=2 N N−1
Jednym argumentem przeciwko stosowaniu niewłaściwego munduru wcześniej w tym przypadku jest to, że tył jest niewłaściwy, gdy , ponieważ jest proporcjonalny do . Ale to ma znaczenie tylko wtedy, gdy lub jest bardzo małe.N=1 θ−1 N=1
źródło
Ponieważ celem tutaj jest prawdopodobnie uzyskanie pewnego ważnego i użytecznego oszacowania , wcześniejszy rozkład powinien być zgodny ze specyfikacją rozkładu populacji, z której pochodzi próbka. Nie oznacza to w żaden sposób, że „obliczamy” wcześniejsze użycie samej próbki - to unieważniłoby ważność całej procedury. Wiemy, że populacja, z której pochodzi próbka, jest populacją iid jednolitych zmiennych losowych, z których każda mieści się w . Jest to przyjęte założenie i jest częścią wcześniejszych informacji, które posiadamy (i nie ma to nic wspólnego z próbką , tj. Z konkretną realizacją podzbioru tych zmiennych losowych).θ [0,θ]
Załóżmy teraz, że ta populacja składa się z zmiennych losowych (podczas gdy nasza próbka składa się z realizacji zmiennych losowych). Utrzymane założenie mówi nam, żem n<m n
dla zwartości . Następnie mamy który można również zapisaćmaxi=1,...,n{Xi}≡X∗ θ≥X∗
Funkcja gęstości z IID Jednolity RV uszeregowanych jestmax N [0,θ]
dla wsparcia i zero w innym miejscu. Następnie, używając i stosując formułę zmiany zmiennej, otrzymujemy wcześniejszy rozkład dla który jest zgodny z zachowanym założeniem:[0,θ] θ=cX∗ θ
co może być niewłaściwe, jeśli nie podamy odpowiednio stałej . Ale naszym interesem jest posiadanie właściwego tylnego dla , a także, nie chcemy ograniczać możliwych wartości (poza ograniczeniem wynikającym z utrzymanego założenia). Więc pozostawiamy nieokreślony. Następnie piszemy a posterior jestc θ θ c
X={x1,..,xn}
dla pewnej stałej normalizującej A. Chcemy
Wstawianie do tylnego
Należy zauważyć, że nieokreślona stała wcześniejszej dystrybucji została dogodnie anulowana.c
Plakat tylny podsumowuje wszystkie informacje, które konkretna próbka może nam przekazać, dotyczące wartości . Jeśli chcemy uzyskać określoną wartość dla , możemy łatwo obliczyć oczekiwaną wartość tylnej,θ θ
Czy w tym wyniku jest jakaś intuicja? Cóż, wraz ze wzrostem liczby , tym bardziej prawdopodobne jest, że maksymalna realizacja wśród nich będzie coraz bliżej ich górnej granicy, - co dokładnie odzwierciedla tylna średnia wartość : jeśli, powiedzmy , , ale jeśli . To pokazuje, że nasza taktyka dotycząca wyboru przełożonego była rozsądna i zgodna z danym problemem, ale w pewnym sensie niekoniecznie „optymalna”.X θ θ N=2⇒E(θ∣X)=2x∗ N=10⇒E(θ∣X)=109x∗
źródło
Twierdzenie o jednolitej wcześniejszej dystrybucji (przypadek przedziałowy):
„Jeśli całość twoich informacji o zewnętrznych w stosunku do danych jest przechwycona przez pojedynczą propozycję wtedy Twoja jedyna możliwa logicznie spójna wcześniejsza specyfikacja toθ D
Zatem wcześniejsza specyfikacja powinna odpowiadać przeorowi Jeffreya, jeśli naprawdę wierzysz w powyższe twierdzenie. ”
Nie stanowi części twierdzenia o jednolitej wcześniejszej dystrybucji:
Alternatywnie możesz podać swój wcześniejszy rozkład jako rozkład Pareto, który jest rozkładem sprzężonym dla munduru, wiedząc, że twój rozkład tylny będzie musiał być innym rozkładem jednolitym przez sprzężenie. Jeśli jednak użyjesz dystrybucji Pareto, będziesz musiał w jakiś sposób określić parametry dystrybucji Pareto.f(θ)
źródło