Załóżmy, że mam zestaw niezależnych, identycznie rozmieszczonych obserwacji jednowymiarowych oraz dwie hipotezy na temat sposobu generowania :
: jest rysowany z pojedynczego rozkładu Gaussa z nieznaną średnią i wariancją.
: z mieszaniny dwóch Gaussów o nieznanej średniej, wariancji i współczynniku mieszania.
Jeśli dobrze rozumiem, są to modele zagnieżdżone, ponieważ model, który reprezentuje można opisać w kategoriach jeśli ograniczysz parametry dwóch Gaussów do identyczności lub ograniczysz współczynnik mieszania do zera dla jednego z dwóch Gaussian.
Dlatego wydaje się, że powinieneś być w stanie użyć algorytmu EM do oszacowania parametrów a następnie użyć Twierdzenia Wilksa, aby ustalić, czy prawdopodobieństwo danych pod jest znacznie większe niż pod . Istnieje niewielki skok wiary w założenie, że algorytm EM zbiega się tutaj z maksymalnym prawdopodobieństwem, ale jestem skłonny to zrobić.
Próbowałem tego w symulacji Monte Carlo, zakładając, że ma 3 stopnie swobody więcej niż (średnia i wariancja dla drugiego Gaussa i parametru mieszania). Kiedy symulowałem dane z , otrzymałem rozkład wartości P, który był zasadniczo nierównomierny i wzbogacony dla małych wartości P. (Jeśli EM nie byłby zbieżny z prawdziwym maksymalnym prawdopodobieństwem, można by oczekiwać dokładnie odwrotnej sytuacji). Co jest złego w moim zastosowaniu twierdzenia Wilksa, które tworzy to uprzedzenie?
Wnioskowanie na temat liczby składników mieszania nie spełnia wymaganych warunków regularności dla twierdzenia Wilksa, ponieważ (a) parametrρ znajduje się na granicy przestrzeni parametrów i (b) parametryzacja jest niemożliwa do zidentyfikowania pod wartością zerową. Nie oznacza to, że rozkład uogólnionego wskaźnika prawdopodobieństwa jest nieznany! Jeśli wszystkie 5 parametrów w konfiguracji są nieznane, a co ważniejsze - nieograniczone, to rozkład statystyki LR nie jest zbieżny. Jeśli wszystkie niemożliwe do zidentyfikowania parametry są ograniczone, wówczas statystyka LR jest monotoniczna w supremum skróconego procesu Gaussa. Kowariancja, której nie da się łatwo obliczyć w ogólnym przypadku (5-parametrowym), a nawet jeśli ją masz, rozkład supremum takiego procesu nie jest łatwo przybliżony. Kilka praktycznych wyników dotyczących dwuskładnikowej mieszaniny znajduje się tutaj. Co ciekawe, artykuł pokazuje, że w dość prostych konfiguracjach statystyka LR jest w rzeczywistości słabsza niż niektóre prostsze statystyki. W artykule podsumowującym na temat wyprowadzania asymptotycznego rozkładu w takich problemach można znaleźć tutaj . Dla wszystkich praktycznych celów możesz dopasować mieszaninę za pomocą EM, a następnie Bootstrap rozkład statystyki LR. Może to zająć trochę czasu, ponieważ EM jest znany jako powolny i potrzeba wielu replikacji, aby uchwycić efekt wielkości próbki. Zobacz tutaj, aby uzyskać szczegółowe informacje.
źródło