Estymatory maksymalnego prawdopodobieństwa (MLE) są asymptotycznie skuteczne; widzimy praktyczny wynik w tym, że często wypadają lepiej niż szacunki metodą momentów (MoM) (gdy się różnią), nawet przy małych próbkach
Tutaj „lepsze niż” oznacza w tym sensie, że zazwyczaj ma mniejszą wariancję, gdy oba są obiektywne, i zazwyczaj mniejszy średni błąd kwadratowy (MSE) bardziej ogólnie.
Powstaje jednak pytanie:
Czy istnieją przypadki, w których MoM może pokonać MLE - na przykład w MSE - w małych próbkach?
(gdy nie jest to jakaś dziwna / zdegenerowana sytuacja - tj. biorąc pod uwagę, że warunki istnienia / utrzymywania ML są asymptotycznie skuteczne)
Kolejne pytanie brzmiałoby: „jak duży może być mały?” - to znaczy, jeśli istnieją przykłady, czy istnieją takie, które nadal zachowują względnie duże rozmiary próbek, być może nawet wszystkie skończone rozmiary próbek?
[Mogę znaleźć przykład stronniczego estymatora, który może pokonać ML w skończonych próbkach, ale to nie jest MoM.]
Uwaga dodana z mocą wsteczną: w tym miejscu skupiam się głównie na przypadku jednowymiarowym (z którego właśnie pochodzi moja podstawowa ciekawość). Nie chcę wykluczyć przypadków wielowymiarowych, ale nie chcę też szczególnie angażować się w dłuższe dyskusje na temat oszacowań Jamesa-Steina.
Odpowiedzi:
Można to uznać za oszustwo, ale estymator OLS jest estymatorem MoM. Rozważ standardową specyfikację regresji liniowej (z regresorami stochastycznymi , więc wielkości są uwarunkowane macierzą regresora) i próbkę o wielkości . Oznacz estymator OLS wariancji terminu błędu. Jest to więc bezstronnen s 2 σ 2K n s2 σ2
Rozważ teraz MLE . To jestσ2
⇒MSe( σ 2 M L )=2(n-K)+K2
Chcemy warunków (jeśli istnieją), w których
Biorąc to pod uwagę, korzenie są dla kwadratoweK
Ogólnie: dla próbki o wielkości i liczby regresorów tak, że mamy Dla na przykład, jeśli wówczas okazuje się, że liczba regresorów musi wynosić aby nierówność się utrzymała. Interesujące jest to, że dla niewielkiej liczby regresorów MLE jest lepszy w sensie MSE.n>12 K ⌈K1⌉<K<⌊K2⌋
DODATEK Można zapisaćK
równanie dla pierwiastków kwadratyki
źródło
„W tym artykule rozważamy nową parametryzację dwuparametrowego odwrotnego rozkładu Gaussa. Znajdujemy estymatory parametrów odwrotnego rozkładu Gaussa metodą momentów i metodą największego prawdopodobieństwa. Następnie porównujemy wydajność estymatory dla obu metod oparte na ich odchyleniu i średnim błędzie kwadratowym (MSE). W tym celu ustalamy wartości parametrów, przeprowadzamy symulacje oraz raportujemy MSE i odchylenie dla oszacowań uzyskanych za pomocą obu metod. Wniosek jest taki, że gdy wielkości próbek wynoszą 10, metoda momentów wydaje się być bardziej wydajna niż metoda maksymalnego prawdopodobieństwa dla oszacowań obu parametrów (lambda i theta) .... " czytaj więcej
W dzisiejszych czasach nie można (lub nie należy) ufać wszystkim opublikowanym, ale ostatnia strona artykułu wydaje się obiecująca. Mam nadzieję, że adres ten zostanie dodany retrospektywnie.
źródło
Według symulacji przeprowadzonych przez Hoskinga i Wallisa (1987) w „Estymacji parametrów i kwantyli dla uogólnionego rozkładu Pareto” parametry dwuparametrowego uogólnionego rozkładu Pareto podane przez cdf
lub gęstość
są bardziej wiarygodne, jeśli są szacowane za pomocą MOM, a nie ML. Dotyczy to próbek do wielkości 500. Szacunki MOM są podane przez
i
z
Artykuł zawiera sporo literówek (przynajmniej moja wersja). Wyniki dla wyżej wymienionych estymatorów MOM zostały uprzejmie dostarczone przez „heropup” w tym wątku .
źródło
Znalazłem jedno:
Do asymetrycznego wykładniczego rozkładu mocy
wyniki symulacji Delicado i Gorii (2008) sugerują, że dla niektórych parametrów przy mniejszych rozmiarach próby metoda momentów może przewyższać MLE; na przykład w known- przypadku próbek o rozmiarze 10, podczas szacowania , MSE MOM jest mniejsza niż ML.θ σ
Delicado i Goria (2008),
Małe porównanie porównania metod maksymalnego prawdopodobieństwa, momentów i momentów L dla asymetrycznego wykładniczego rozkładu mocy,
Journal Computational Statistics & Data Analysis
Volume 52 Issue 3, January, str. 1661-1673
(patrz także http://www-eio.upc.es/~delicado/my-public-files/LmomAEP.pdf )
źródło
Metoda momentów (MM) może pobić podejście oparte na maksymalnym prawdopodobieństwie (ML), gdy możliwe jest określenie tylko niektórych momentów populacji. Jeśli rozkład jest źle zdefiniowany, estymatory ML nie będą spójne.
Zakładając skończone momenty i obserwacje, MM może zapewnić dobre estymatory z ładnymi właściwościami asymptotycznymi.
Przykład: Niech będzie próbką , gdzie jest nieznaną funkcją gęstości prawdopodobieństwa. Określić o th chwili i uważa, że procentowa jest oszacowanie dalej chwili .X1,…,Xn X∼f f:R→R+ νk=∫Rxkf(x)dx k ν4
Niech , a następnie przyjmując, że , centralne twierdzenie o limicie gwarantuje, że gdzie „ ” oznacza „zbiega się w dystrybucji do” . Ponadto, według twierdzenia Słuckiego,Xk¯=1n∑ni=1Xki ν8<∞
Oznacza to, że możemy wyciągnąć (przybliżone) wnioski dla , stosując podejście momentowe (dla dużych próbek), musimy jedynie przyjąć pewne założenia dotyczące interesujących momentów populacji. W tym przypadku nie można zdefiniować estymatorów maksymalnego prawdopodobieństwa bez znajomości kształtu . fν4 f
Badanie symulacyjne:
Patriota i in. (2009) przeprowadził kilka badań symulacyjnych w celu weryfikacji wskaźników odrzucenia testów hipotez w modelu błędów zmiennych. Wyniki sugerują, że metoda MM generuje poziomy błędów przy hipotezie zerowej bliższej poziomowi nominalnemu niż poziom ML dla małych próbek.
Nota historyczna:
Metodę chwil zaproponował K. Pearson w 1894 r. „Wkład w matematyczną teorię ewolucji”. Metodę największego prawdopodobieństwa zaproponował RA Fisher w 1922 r. „O matematycznych podstawach statystyki teoretycznej”. Oba artykuły zostały opublikowane w Philosophical Transactions of Royal Society of London, Series A.
Odniesienie:
Fisher, RA (1922). O matematycznych podstawach statystyki teoretycznej, transakcjach filozoficznych Royal Society of London, Seria A, 222, 309-368.
Patriota, AG, Bolfarine, H, de Castro, M (2009). Heteroscedastyczny model strukturalnych błędów w zmiennych z błędem równania, Metodologia statystyczna 6 (4), 408-423 ( pdf )
Pearson, K (1894). Wkład w matematyczną teorię ewolucji, transakcje filozoficzne Royal Society of London, Seria A, 185, 71-110.
źródło
Dodatkowe źródła na korzyść MOM:
Hong, HP i W. Ye. 2014. Analiza ekstremalnych obciążeń śniegiem gruntu dla Kanady z wykorzystaniem zapisów głębokości śniegu . Zagrożenia naturalne 73 (2): 355–371.
Martins, ES i JR Stedinger. 2000. Uogólnione estymatory kwantyli o największej wartości prawdopodobieństwa dla danych hydrologicznych . Badania zasobów wodnych 36 (3): 737–744.
Abstrakcyjny:
W sekcjach Wprowadzenie i przegląd literatury cytują dodatkowe artykuły, w których stwierdzono, że MOM w niektórych przypadkach przewyższa MLE (ponownie modelowanie wartości ekstremalnej), np.
K (kappa) jest parametrem kształtu GEV.
artykuły pojawiające się w cytatach:
Hosking J, Wallis J, Wood E (1985) Oszacowanie uogólnionego rozkładu wartości ekstremalnych za pomocą momentów ważonych prawdopodobieństwem . Technometrics 27: 251–261.
Madsen, H., PF Rasmussen i D. Rosbjerg (1997) Porównanie rocznych metod szeregów maksymalnych i częściowych czasów trwania do modelowania ekstremalnych zdarzeń hydrologicznych , 1, Modelowanie w terenie, Zasoby wodne. Res., 33 (4), 747–758.
Hosking, JRM, L-momenty: Analiza i estymacja rozkładów z wykorzystaniem liniowych kombinacji statystyki rzędu , JR Stat. Soc., Ser. B, 52, 105-124, 1990.
Ponadto mam takie same doświadczenia, jak wnioski zawarte w powyższych artykułach, w przypadku modelowania ekstremalnych zdarzeń przy małej i średniej wielkości próby (typowo <50-100) MLE może dawać nierealne wyniki, symulacja pokazuje, że MOM jest bardziej solidny i ma mniejszy RMSE.
źródło
Odpowiadając na to: Szacując parametry dwumianu natknąłem się na ten artykuł:
Ingram Olkin, A John Petkau, James V Zidek: Porównanie estymatorów N dla rozkładu dwumianowego. Jasa 1981.
co daje przykład, w którym metoda momentów, przynajmniej w niektórych przypadkach, przekracza maksymalne prawdopodobieństwo. Problemem jest oszacowanie w rozkładzie dwumianowym którym oba parametry są nieznane. Pojawia się na przykład przy próbie oszacowania liczebności zwierząt, gdy nie można zobaczyć wszystkich zwierząt, a prawdopodobieństwo obserwacji również jest nieznane.Bin ( N , p ) strN Bin(N,p) p
źródło