Jaka jest dobra ogólna zasada wyboru pytania dla hipotezy zerowej. Na przykład, jeśli chcę sprawdzić, czy hipoteza B jest prawdziwa, czy powinienem użyć B jako zerowej, B jako alternatywnej hipotezy, czy NIE B jako zerowej? Mam nadzieję, że pytanie jest jasne. Wiem, że ma to coś wspólnego z błędem, który chcę zminimalizować (typ I?), Ale wciąż zapominam, jak to idzie, ponieważ nie mam na to jasnej intuicji. Dzięki.
hypothesis-testing
Nestor
źródło
źródło
Odpowiedzi:
Zasadą dobrego mojego doradcy było ustawienie hipotezy zerowej na wynik, którego nie chcesz być prawdziwy, tj. Wynik, którego bezpośrednie przeciwieństwo chcesz pokazać.
Podstawowy przykład: Załóżmy, że opracowałeś nowe leczenie i chcesz pokazać, że jest ono rzeczywiście lepsze niż placebo. Więc ustawiłeś hipotezę zerową nowy lek jest równy lub gorszy niż placebo, a alternatywna hipoteza H 1 : = nowe leczenie jest lepsze niż placebo.H0:= H1:=
Jest tak, ponieważ w trakcie testu statystycznego albo odrzucasz hipotezę zerową (i faworyzujesz alternatywną hipotezę), albo nie możesz jej odrzucić. Ponieważ twoim „celem” jest odrzucenie hipotezy zerowej, ustawiłeś ją na wynik, którego nie chcesz być prawdą.
Uwaga dodatkowa: Zdaję sobie sprawę, że nie należy przeprowadzać testu statystycznego, aby go przekręcić i złamać, dopóki hipoteza zerowa nie zostanie odrzucona, zwykły język został użyty tylko w celu ułatwienia zapamiętania tej reguły.
Może to również być pomocne: jakie jest znaczenie wartości p it wartości w testach statystycznych? i / lub Jakie jest dobre wprowadzenie do testowania hipotez statystycznych dla informatyków?
źródło
Jeśli hipoteza B jest interesującą hipotezą, możesz przyjąć wartość nie-B jako hipotezę zerową i kontrolować, poniżej wartości zerowej, prawdopodobieństwo błędu typu I w przypadku błędnego odrzucenia wartości innej niż B na poziomieα . Odrzucenie nie-B jest następnie interpretowane jako dowód na korzyść B, ponieważ kontrolujemy błąd typu I, dlatego jest mało prawdopodobne, aby nie-B było prawdziwe. Zmieszany ... ?
Weźmy przykład leczenia vs. brak leczenia w dwóch grupach z populacji. Interesującą hipotezą jest to, że leczenie ma wpływ, to znaczy, że istnieje różnica między grupą leczoną a grupą nieleczoną z powodu leczenia. Hipotezą zerową jest to, że istnieje ma różnicy i kontrolujemy prawdopodobieństwo błędnego odrzucenia tej hipotezy. W ten sposób kontrolujemy prawdopodobieństwo błędnego stwierdzenia, że istnieje efekt leczenia, gdy nie ma efektu leczenia. Błąd typu II to prawdopodobieństwo błędnego zaakceptowania wartości zerowej, gdy występuje efekt leczenia.
Powyższe sformułowanie opiera się na strukturze Neymana-Pearsona do testowania statystycznego, w której testowanie statystyczne jest postrzegane jako problem decyzyjny między przypadkami, zerą i alternatywą. Poziom hipoteza zerowa (zamiast tego akceptujemy hipotezę zerową). Dlatego powinniśmy uważać, aby dojść do wniosku, że hipoteza zerowa jest prawdziwa tylko dlatego, że nie możemy jej odrzucić.α jest ułamkiem razy, gdy popełniamy błąd typu I, jeśli (niezależnie) powtarzamy test. W tych ramach tak naprawdę nie ma formalnego rozróżnienia między wartością zerową a alternatywą. Jeśli zamienimy zero i alternatywę, wymienimy prawdopodobieństwo błędów typu I i typu II. Nie kontrolowaliśmy jednak powyżej prawdopodobieństwa błędu typu II (zależy to od tego, jak duży jest efekt leczenia), a ze względu na tę asymetrię możemy raczej powiedzieć, że nie odrzucamy
W fisheryjskim systemie testowania istotności istnieje tak naprawdę hipoteza zerowa, a pod nią zerowana jest wartość dla obserwowanych danych. Mniejsze wartości p są interpretowane jako silniejszy dowód przeciwko zeru. Tutaj hipoteza zerowa jest zdecydowanie nie-B (brak efektu leczenia), a wartość p jest interpretowana jako ilość dowodów przeciwko zeru. Przy małej wartości p możemy z całą pewnością odrzucić wartość zerową, że nie ma efektu leczenia i stwierdzić, że jest efekt leczenia. W tych ramach możemy tylko odrzucić lub nie odrzucić (nigdy nie zaakceptować) wartości zerowej, a wszystko polega na fałszowaniu wartości zerowej. Zauważ, że pp p p p p -wartość nie musi być uzasadniona (wyobrażoną) wielokrotną liczbą decyzji.
Żadna z ram nie jest bezproblemowa, a terminologia jest często pomieszana. Mogę polecić książkę Dowody statystyczne: paradygmat prawdopodobieństwa autorstwa Richarda M. Royalla dla jasnego potraktowania różnych pojęć.
źródło
„Częstotliwością” jest wymyślenie zerowej hipotezy o postaci „nie B”, a następnie argumentowanie przeciwko „nie B”, jak w odpowiedzi Steffena. Jest to logiczny odpowiednik sformułowania argumentu „Mylisz się, dlatego muszę mieć rację”. Tego rodzaju rozumowanie wykorzystuje polityk (tzn. Druga partia jest zła, dlatego jesteśmy dobrzy). Na podstawie tego rodzaju rozumowania dość trudno jest poradzić sobie z więcej niż jedną alternatywą. Wynika to z tego, że argument „mylisz się, więc mam rację” ma sens tylko wtedy, gdy nie jest możliwe, aby oba były w błędzie, co z pewnością może się zdarzyć, gdy istnieje więcej niż jedna alternatywna hipoteza.
Odpowiedź „bayesowska” polega po prostu na obliczeniu prawdopodobieństwa hipotezy, którą jesteś zainteresowany testowaniem, w zależności od posiadanych dowodów. Zawsze zawiera to wcześniejsze informacje, które są po prostu założeniami, które uczyniły twój problem dobrze postawionym (wszystkie procedury statystyczne opierają się na wcześniejszych informacjach, a bayesowskie tylko je bardziej jednoznacznie wyrażają). Zwykle składa się również z niektórych danych, a my twierdzimy Bayesa
źródło
Hipoteza zerowa powinna zasadniczo zakładać, że różnice w zmiennej odpowiedzi wynikają wyłącznie z błędu.
Na przykład, jeśli chcesz przetestować wpływ jakiegoś czynnikaH.0 = Nie ma wpływu
A
na odpowiedźx
, wówczas wartość null to:A
na odpowiedźx
.Nie odrzucenie tej hipotezy zerowej zostanie zinterpretowane jako:
1) wszelkie różnice
x
wynikają wyłącznie z błędu, a nie,A
lub2) dane nie są wystarczające do wykrycia różnicy, nawet jeśli istnieje (patrz błąd typu 2 poniżej).
Odrzucenie tej hipotezy zerowej byłoby interpretowane jako hipoteza alternatywna:H.za = Istnieje wpływ
A
na odpowiedźx
, to prawda.Błędy typu 1 i typu 2 są związane z zastosowaniem hipotezy zerowej, ale tak naprawdę nie są jej przeznaczeniem. Błąd typu 1 występuje po odrzuceniuH.0 choć prawdą jest - to znaczy, że nieprawidłowo zawarcia wpływu H.0 nawet jeśli jest to fałsz - to znaczy, błędnie wnioskujesz, że nie ma żadnego wpływu
A
nax
kiedy jeden nie istnieje. Błąd typu 2 występuje, gdy nie uda się odrzucićA
na,x
nawet jeśli taki istnieje.źródło