Jestem matematykiem, samokształcącym się statystyką i walczącym szczególnie z językiem.
W książce, której używam, występuje następujący problem:
Losowa zmienna jest podana jako -dystrybucja z . (Oczywiście ze względu na to pytanie można wziąć dowolny rozkład w zależności od jednego parametru). Następnie podaje się próbkę pięciu wartości , , , , .
Pierwsza część: „Korzystając z metody największego prawdopodobieństwa, znajdź oszacowanie z na podstawie [próbki].” To nie był problem. Odpowiedź brzmi .
Ale potem: „Podaj przybliżony błąd standardowy .”
Co to znaczy? Ponieważ jest tylko stałą liczbą rzeczywistą, nie widzę, w jaki sposób mógłby mieć standardowy błąd. Czy mam określić odchylenie standardowe ?
Jeśli uważasz, że pytanie nie jest jasne, te informacje również by mi pomogły.
źródło
Odpowiedzi:
Inna odpowiedź obejmowała wyprowadzenie błędu standardowego, chcę tylko pomóc w notacji:
Twoje zamieszanie wynika z faktu, że w statystykach używamy dokładnie tego samego symbolu do oznaczenia estymatora (który jest funkcją) oraz konkretnego oszacowania (czyli wartości, którą estymator przyjmuje, gdy otrzymuje jako dane wejściowe konkretną zrealizowaną próbkę).
Tak α = h ( X ) i α ( X = x ) = 4,6931 dla x = { 14 ,α^= h ( X ) α^(X=x)=4.6931 . Więc α ( X ) jest funkcją zmiennych losowych i tak w samej zmiennej losowej, że na pewno ma wariancji. x={14,21,6,32,2} α^(X)
W estymacji ML w wielu przypadkach możemy obliczyć standardowy błąd asymptotyczny , ponieważ rozkład skończonej próby estymatora nie jest znany (nie można go wyprowadzić).
Ściśle nie ma rozkład asymptotycznej, ponieważ jest zbieżny do liczby rzeczywistej (prawdziwy numer w prawie wszystkich przypadkach oszacowania ml). Ale ilość √α^ zbieżny do normalnej zmiennej losowej (przy zastosowaniu twierdzenia Limit centralny).n−−√(α^−α)
Drugi punkt notacji zamieszania : większość, jeśli nie wszystkie teksty, napisze ( „Avar” = wariancji asymptotycznej "), podczas gdy to, co znaczy to Awarów ( √Avar(α^) , to znaczy, że znajdują się w asymptotycznej wariancji ilości √Avar(n−−√(α^−α)) , nie stanowi alfa ... W przypadku podstawowego rozkładu Pareto mamyn−−√(α^−α) α^
i tak
(ale co znajdziesz napisany jest )Avar(α^)=α2
Teraz, w jakim sensie prognozy α ma „asymptotyczne odchylenie”, ponieważ, jak powiedział, że zbiega asymptotycznie do stałej? Cóż, w przybliżeniu i dla dużych, ale skończonych próbek. Czyli gdzieś pomiędzy „małą” próbką, w której estymator jest zmienną losową o (zwykle) nieznanym rozkładem, a „nieskończoną” próbką, w której estymator jest stały, istnieje „duże, ale skończone terytorium próbki”, w którym estymator nie stał się jeszcze stały, a jego rozkład i wariancja wyprowadza się w sposób okrężny, najpierw stosując Centralne Twierdzenie Graniczne, aby uzyskać odpowiednio asymptotyczny rozkład wielkości Z = √α^ (co jest normalne w wyniku CLT), a następnie odwracać się i zapisu α = 1Z=n−−√(α^−α) (a jednocześnie o jeden krok i leczenianW skończonych), która pokazuje,ajako funkcji afinicznej normalnej zmiennej losowejZi zwykle tak rozmieszczone się (zawsze w przybliżeniu).α^=1n√Z+α n α^ Z
źródło
- maksymalny estymator prawdopodobieństwa - zależy od wybranych losowo, a więc jest również przypadkowy (nie jest stała). Oszacowanie błędu standardowego alfa można uzyskać z informacji Fishera,α^ α^
Gdzie jest parametrem, a L ( θ | Y = y ) jest funkcją logarytmu wiarygodności θ zależną od losowej próbki y . Intuicyjnie informacja Fishera wskazuje na nachylenie krzywizny powierzchni prawdopodobieństwa kłody wokół MLE, a więc ilość „informacji”, które y dostarcza około θ .θ L(θ|Y=y) θ y y θ
Dla rozkładu z pojedynczą realizacją Y = y , prawdopodobieństwo logarytmiczne, w którym y 0 jest znane:Pareto(α,y0) Y=y y0
Podłączenie do definicji informacji Fishera, I(α)=1
źródło