Robię eksperyment liczbowy, który polega na próbkowaniu logarytmicznego rozkładu i próbuję oszacować momenty dwiema metodami:
- Patrząc na średnią próbną
- Oszacowanie i przy użyciu przykładowych środków dla , a następnie wykorzystując fakt, że dla rozkładu logarytmicznego mamy .
Pytanie brzmi :
Odkryłem eksperymentalnie, że druga metoda działa znacznie lepiej niż pierwsza, gdy utrzymuję stałą liczbę próbek i zwiększam o jakiś czynnik T. Czy istnieje jakieś proste wytłumaczenie tego faktu?
Dołączam cyfrę, na której oś x to T, zaś oś y to wartości porównujące prawdziwe wartości (pomarańczowa linia), do wartości szacunkowych. metoda 1 - niebieskie kropki, metoda 2 - zielone kropki oś y jest w skali logarytmicznej
EDYTOWAĆ:
Poniżej znajduje się minimalny kod Mathematica do wygenerowania wyników dla jednego T, z wynikiem:
ClearAll[n,numIterations,sigma,mu,totalTime,data,rmomentFromMuSigma,rmomentSample,rmomentSample]
(* Define variables *)
n=2; numIterations = 10^4; sigma = 0.5; mu=0.1; totalTime = 200;
(* Create log normal data*)
data=RandomVariate[LogNormalDistribution[mu*totalTime,sigma*Sqrt[totalTime]],numIterations];
(* the moment by theory:*)
rmomentTheory = Exp[(n*mu+(n*sigma)^2/2)*totalTime];
(*Calculate directly: *)
rmomentSample = Mean[data^n];
(*Calculate through estimated mu and sigma *)
muNumerical = Mean[Log[data]]; (*numerical \[Mu] (gaussian mean) *)
sigmaSqrNumerical = Mean[Log[data]^2]-(muNumerical)^2; (* numerical gaussian variance *)
rmomentFromMuSigma = Exp[ muNumerical*n + (n ^2sigmaSqrNumerical)/2];
(*output*)
Log@{rmomentTheory, rmomentSample,rmomentFromMuSigma}
Wydajność:
(*Log of {analytic, sample mean of r^2, using mu and sigma} *)
{140., 91.8953, 137.519}
powyżej, drugi wynik to średnia próbki , która jest poniżej dwóch pozostałych wyników
źródło
Odpowiedzi:
W tych wynikach jest coś zagadkowego
ale wynikają one z problemu, a nie z obliczeń numerycznych: powtórzyłem eksperyment w R i otrzymałem następujący obraz z tym samym kodem koloru i tą samą sekwencją i , który reprezentuje każdy estymator podzielony przez prawdziwe oczekiwania:μT σT
Oto odpowiedni kod R:
Stąd rzeczywiście zapada się drugi moment empiryczny, gdy rośnie i , co przypisałbym ogromnemu wzrostowi wariancji wspomnianego drugiego momentu empirycznego, gdy rośnie i .μ σ μ σ
źródło
Pomyślałem, że rzuciłem figi, które pokazują, że wykresy user29918 i Xi'an są spójne. Ryc. 1 pokazuje, co zrobił użytkownik29918, a ryc. 2 (w oparciu o te same dane) robi to, co Xi'an zrobił dla swojego wykresu. Ten sam wynik, inna prezentacja.
Co się dzieje, gdy T rośnie, wariancje stają się ogromne, a estymator staje się jak próba oszacowania średniej populacji Powerball Lotto poprzez zakup biletów Lotto! W dużej części czasu nie docenisz wypłaty (ponieważ żadna obserwacja próbki nie trafi w dziesiątkę), a niewielki procent czasu znacznie przeszacujesz wypłatę (ponieważ w próbie jest zwycięzca głównej wygranej). Średnia z próby jest obiektywnym oszacowaniem, ale nie jest sprecyzowana, nawet przy tysiącach losowań! W rzeczywistości, ponieważ coraz trudniej jest wygrać w lotto, Twoja średnia próbki będzie mniejsza niż średnia populacji w przeważającej części czasu.1n∑ix2i
Dalsze komentarze:
źródło