Zastanawiam się, czy zawsze istnieje maksymalizator dla jakiegokolwiek problemu z oszacowaniem maksymalnego (log-) prawdopodobieństwa? Innymi słowy, czy istnieje jakiś rozkład i niektóre jego parametry, dla których problem MLE nie ma maksymalizatora?
Moje pytanie pochodzi od twierdzenia inżyniera, że funkcja kosztu (prawdopodobieństwo lub logarytmiczne prawdopodobieństwo, nie jestem pewien, który był zamierzony) w MLE jest zawsze wklęsła i dlatego zawsze ma maksymalizator.
Dziękuję i pozdrawiam!
Odpowiedzi:
Być może inżynier miał na myśli kanoniczne rodziny wykładnicze: w ich naturalnej parametryzacji przestrzeń parametrów jest wypukła, a prawdopodobieństwo logarytmiczne jest wklęsłe (patrz Thm 1.6.3 w Mathematical Statistics Bickel & Doksum , tom 1 ). Ponadto, w pewnych łagodnych warunkach technicznych (w zasadzie, że model ma „pełną rangę” lub równoważnie, że parametr naturalny można zidentyfikować), funkcja logarytmu prawdopodobieństwa jest ściśle wklęsła, co oznacza, że istnieje wyjątkowy maksymalizator. (Wniosek 1.6.2 w tym samym odnośniku.) [Również uwagi do wykładu cytowane przez @biostat mają ten sam punkt.]
Należy zauważyć, że naturalna parametryzacja kanonicznej rodziny wykładniczej zwykle różni się od standardowej parametryzacji. Tak więc, chociaż @cardinal wskazuje, że prawdopodobieństwo dziennika dla rodziny nie jest wypukłe w , będzie wklęsłe w parametrach naturalnych, które są i .N.( μ , σ2)) σ2) η1= μ / σ2) η2)= - 1 / σ2)
źródło
Funkcja wiarygodności często osiąga maksimum w celu oszacowania parametru będącego przedmiotem zainteresowania. Niemniej jednak czasami MLE nie istnieje, na przykład dla rozkładu mieszaniny Gaussa lub funkcji nieparametrycznych, które mają więcej niż jeden pik (bi lub multimodalny). Często spotykam się z problemem oszacowania genetyki populacji nieznanych parametrów, tj. Wskaźników rekombinacji, efektu selekcji naturalnej.
Jednym z powodów jest również to, że @cardinal wskazuje na nieograniczoną przestrzeń parametryczną.
Ponadto poleciłbym następujący artykuł , patrz sekcja 3 (funkcja) i ryc. 3. Istnieją jednak bardzo przydatne i przydatne informacje o dokumencie dotyczące MLE.
źródło
Przyznaję, że coś mi umknęło, ale -
Jeśli jest to problem z oszacowaniem, a celem jest oszacowanie nieznanego parametru, a wiadomo, że parametr pochodzi z jakiegoś zestawu zamkniętego i ograniczonego, a funkcja prawdopodobieństwa jest ciągła, wówczas musi istnieć wartość tego parametru, która maksymalizuje funkcja prawdopodobieństwa. Innymi słowy, musi istnieć maksimum. (Nie musi być unikalny, ale musi istnieć co najmniej jedno maksimum. Nie ma gwarancji, że wszystkie lokalne maksima będą maksymami globalnymi, ale nie jest to warunek konieczny do istnienia maksimum).
Nie wiem, czy funkcja prawdopodobieństwa zawsze musi być wypukła, ale nie jest to warunek konieczny, aby istniało maksimum.
Gdybym coś przeoczył, chętnie usłyszałbym to, czego mi brakuje.
źródło
Być może komuś przyda się następujący prosty przykład.
Zastanów się raz rzuć monetą. Niech oznacza prawdopodobieństwo głów. Jeśli wiadomo, że moneta może wychodzić zarówno z główek, jak i reszek, to . Ponieważ zestaw jest otwarty, przestrzeń parametrów nie jest zwarta. Prawdopodobieństwo jest podane przez W żadnym przypadku nie ma maksymalnej wartości on .θ θ ∈ ( 0 , 1 ) ( 0 , 1 ) θ
źródło