Czytam artykuł, którego metoda jest w pełni oparta na teście współczynnika wiarygodności. Autor mówi, że test LR na jednostronne alternatywy to UMP. Kontynuuje, twierdząc, że
„... nawet jeśli nie można wykazać, że [test LR] jest jednorodnie najsilniejszy, test LR często ma pożądane właściwości statystyczne”.
Zastanawiam się, jakie są tutaj właściwości statystyczne. Biorąc pod uwagę, że autor odnosi się do tych przemijających, zakładam, że są one powszechnie znane wśród statystyk.
Jedyną pożądaną właściwością, jaką udało mi się do tej pory znaleźć, jest asymptotyczny rozkład chi-kwadrat (w pewnych warunkach regularności), gdzie to stosunek LR.λ
Byłbym również wdzięczny za odniesienie do klasycznego tekstu, w którym można przeczytać o tych pożądanych właściwościach.
Odpowiedzi:
Warto przeczytać Co dalej, jeśli nie odrzucimy hipotezy zerowej? przed wyjaśnieniem poniżej.
Pożądane właściwości: moc
W testowaniu hipotez celem jest znalezienie „dowodów statystycznych” dla . W ten sposób możemy popełnić błędy typu I, tj. Odrzucamy H 0 (i stwierdzamy, że istnieją dowody na korzyść H 1 ), podczas gdy H 0 było prawdziwe (tj. H 1 jest fałszywe). Zatem błędem typu I jest „znajdowanie fałszywych dowodów” na H 1 .H.1 H.0 H.1 H.0 H.1 H.1
Błąd typu II powstaje, gdy nie może zostać odrzucony, podczas gdy w rzeczywistości jest fałszem, tzn. „Akceptujemy H 0 ” i „pomijamy” dowody na H 1 .H.0 H.0 H.1
Prawdopodobieństwo błędu typu I jest oznaczone przez , wybrany poziom istotności. Prawdopodobieństwo błędu typu II jest oznaczone jako β, a 1 - β nazywa się siłą testu, jest to prawdopodobieństwo znalezienia dowodów na korzyść H 1, gdy H 1 jest prawdziwe.α β 1 - β H.1 H.1
W testowaniu hipotez statystycznych naukowiec ustala górny próg prawdopodobieństwa błędu typu I i pod tym ograniczeniem próbuje znaleźć test o maksymalnej mocy, biorąc pod uwagę .α
Pożądane właściwości testów współczynnika wiarygodności mają związek z mocą
W teście hipotezy porównaniu z H 1 : θ = θ 1 hipoteza zerowa i hipoteza alternatywna nazywane są „prostymi”, tzn. Parametr jest ustalony na jedną wartość, równie dobrze pod H 0 jak pod H 1 (a dokładniej; rozkłady są w pełni określone).H.0: θ = θ0 H.1: θ = θ1 H.0 H.1
Neyman-Pearson Lemat stwierdza, że do testów hipotezy o prostych hipotez, a dla danego prawdopodobieństwa błędu typu I, test ilorazu wiarygodności ma największą moc. Oczywiście, wysoka moc, biorąc pod uwagę jest pożądaną właściwością: moc jest miarą „jak łatwo jest znaleźć dowody na obecność H 1 ”.α H.1
Gdy hipoteza jest złożona; jak np. kontra H 1 : θ > θ 1, wówczas nie można zastosować lematu Neymana-Pearsona, ponieważ w H 1 występuje wiele wartości . Jeśli można znaleźć taki test, który jest najsilniejszy dla każdej wartości „poniżej H 1 ”, wówczas mówi się, że test ten jest „jednorodnie najpotężniejszy” (UMP) (tj. Najsilniejszy dla każdej wartości poniżej H 1 ).H.0: θ = θ1 H.1: θ > θ1 H.1 H.1 H.1
Istnieje twierdzenie Karlina i Rubina, które stwarza warunki niezbędne do tego, aby test współczynnika prawdopodobieństwa był jednakowo najsilniejszy. Warunki te są spełnione dla wielu testów jednostronnych (jednoczynnikowych).
Zatem pożądana właściwość testu współczynnika wiarygodności polega na tym, że w kilku przypadkach ma on najwyższą moc (chociaż nie we wszystkich przypadkach).
W większości przypadków nie można pokazać istnienia testu UMP, aw wielu przypadkach (zwłaszcza na wielu odmianach) można wykazać, że test UMP nie istnieje. Niemniej jednak w niektórych z tych przypadków stosuje się testy współczynnika prawdopodobieństwa ze względu na ich pożądane właściwości (w powyższym kontekście), ponieważ są one stosunkowo łatwe do zastosowania, a czasami dlatego, że nie można zdefiniować innych testów.
Na przykład jednostronnym testem opartym na standardowym rozkładzie normalnym jest UMP.
Intuicja stojąca za testem współczynnika wiarygodności:
Znalazłem ten plik pdf w Internecie.
źródło