Jak określić hipotezę zerową w testowaniu hipotez

15

Jaka jest dobra ogólna zasada wyboru pytania dla hipotezy zerowej. Na przykład, jeśli chcę sprawdzić, czy hipoteza B jest prawdziwa, czy powinienem użyć B jako zerowej, B jako alternatywnej hipotezy, czy NIE B jako zerowej? Mam nadzieję, że pytanie jest jasne. Wiem, że ma to coś wspólnego z błędem, który chcę zminimalizować (typ I?), Ale wciąż zapominam, jak to idzie, ponieważ nie mam na to jasnej intuicji. Dzięki.

Nestor
źródło
Chłopaki ... doskonałe odpowiedzi. Wszystko pomocne. Wciąż mnie to zaskakuje, gdy uzyskuję taki poziom współpracy w Internecie, tylko dlatego, że ludzie są zainteresowani. wow ... dzięki!
Nestor

Odpowiedzi:

17

Zasadą dobrego mojego doradcy było ustawienie hipotezy zerowej na wynik, którego nie chcesz być prawdziwy, tj. Wynik, którego bezpośrednie przeciwieństwo chcesz pokazać.

Podstawowy przykład: Załóżmy, że opracowałeś nowe leczenie i chcesz pokazać, że jest ono rzeczywiście lepsze niż placebo. Więc ustawiłeś hipotezę zerową nowy lek jest równy lub gorszy niż placebo, a alternatywna hipoteza H 1 : = nowe leczenie jest lepsze niż placebo.H0:=H1:=

Jest tak, ponieważ w trakcie testu statystycznego albo odrzucasz hipotezę zerową (i faworyzujesz alternatywną hipotezę), albo nie możesz jej odrzucić. Ponieważ twoim „celem” jest odrzucenie hipotezy zerowej, ustawiłeś ją na wynik, którego nie chcesz być prawdą.

Uwaga dodatkowa: Zdaję sobie sprawę, że nie należy przeprowadzać testu statystycznego, aby go przekręcić i złamać, dopóki hipoteza zerowa nie zostanie odrzucona, zwykły język został użyty tylko w celu ułatwienia zapamiętania tej reguły.

Może to również być pomocne: jakie jest znaczenie wartości p it wartości w testach statystycznych? i / lub Jakie jest dobre wprowadzenie do testowania hipotez statystycznych dla informatyków?

steffen
źródło
6

Jeśli hipoteza B jest interesującą hipotezą, możesz przyjąć wartość nie-B jako hipotezę zerową i kontrolować, poniżej wartości zerowej, prawdopodobieństwo błędu typu I w przypadku błędnego odrzucenia wartości innej niż B na poziomie α . Odrzucenie nie-B jest następnie interpretowane jako dowód na korzyść B, ponieważ kontrolujemy błąd typu I, dlatego jest mało prawdopodobne, aby nie-B było prawdziwe. Zmieszany ... ?

Weźmy przykład leczenia vs. brak leczenia w dwóch grupach z populacji. Interesującą hipotezą jest to, że leczenie ma wpływ, to znaczy, że istnieje różnica między grupą leczoną a grupą nieleczoną z powodu leczenia. Hipotezą zerową jest to, że istnieje ma różnicy i kontrolujemy prawdopodobieństwo błędnego odrzucenia tej hipotezy. W ten sposób kontrolujemy prawdopodobieństwo błędnego stwierdzenia, że ​​istnieje efekt leczenia, gdy nie ma efektu leczenia. Błąd typu II to prawdopodobieństwo błędnego zaakceptowania wartości zerowej, gdy występuje efekt leczenia.

Powyższe sformułowanie opiera się na strukturze Neymana-Pearsona do testowania statystycznego, w której testowanie statystyczne jest postrzegane jako problem decyzyjny między przypadkami, zerą i alternatywą. Poziom hipoteza zerowa (zamiast tego akceptujemy hipotezę zerową). Dlatego powinniśmy uważać, aby dojść do wniosku, że hipoteza zerowa jest prawdziwa tylko dlatego, że nie możemy jej odrzucić.α jest ułamkiem razy, gdy popełniamy błąd typu I, jeśli (niezależnie) powtarzamy test. W tych ramach tak naprawdę nie ma formalnego rozróżnienia między wartością zerową a alternatywą. Jeśli zamienimy zero i alternatywę, wymienimy prawdopodobieństwo błędów typu I i typu II. Nie kontrolowaliśmy jednak powyżej prawdopodobieństwa błędu typu II (zależy to od tego, jak duży jest efekt leczenia), a ze względu na tę asymetrię możemy raczej powiedzieć, że nie odrzucamy

W fisheryjskim systemie testowania istotności istnieje tak naprawdę hipoteza zerowa, a pod nią zerowana jest wartość dla obserwowanych danych. Mniejsze wartości p są interpretowane jako silniejszy dowód przeciwko zeru. Tutaj hipoteza zerowa jest zdecydowanie nie-B (brak efektu leczenia), a wartość p jest interpretowana jako ilość dowodów przeciwko zeru. Przy małej wartości p możemy z całą pewnością odrzucić wartość zerową, że nie ma efektu leczenia i stwierdzić, że jest efekt leczenia. W tych ramach możemy tylko odrzucić lub nie odrzucić (nigdy nie zaakceptować) wartości zerowej, a wszystko polega na fałszowaniu wartości zerowej. Zauważ, że pppppp-wartość nie musi być uzasadniona (wyobrażoną) wielokrotną liczbą decyzji.

Żadna z ram nie jest bezproblemowa, a terminologia jest często pomieszana. Mogę polecić książkę Dowody statystyczne: paradygmat prawdopodobieństwa autorstwa Richarda M. Royalla dla jasnego potraktowania różnych pojęć.

NRH
źródło
5

„Częstotliwością” jest wymyślenie zerowej hipotezy o postaci „nie B”, a następnie argumentowanie przeciwko „nie B”, jak w odpowiedzi Steffena. Jest to logiczny odpowiednik sformułowania argumentu „Mylisz się, dlatego muszę mieć rację”. Tego rodzaju rozumowanie wykorzystuje polityk (tzn. Druga partia jest zła, dlatego jesteśmy dobrzy). Na podstawie tego rodzaju rozumowania dość trudno jest poradzić sobie z więcej niż jedną alternatywą. Wynika to z tego, że argument „mylisz się, więc mam rację” ma sens tylko wtedy, gdy nie jest możliwe, aby oba były w błędzie, co z pewnością może się zdarzyć, gdy istnieje więcej niż jedna alternatywna hipoteza.

Odpowiedź „bayesowska” polega po prostu na obliczeniu prawdopodobieństwa hipotezy, którą jesteś zainteresowany testowaniem, w zależności od posiadanych dowodów. Zawsze zawiera to wcześniejsze informacje, które są po prostu założeniami, które uczyniły twój problem dobrze postawionym (wszystkie procedury statystyczne opierają się na wcześniejszych informacjach, a bayesowskie tylko je bardziej jednoznacznie wyrażają). Zwykle składa się również z niektórych danych, a my twierdzimy Bayesa

P(H0|DI)=P(H0|I)P(D|H0I)kP(Hk|I)P(D|HkI)

H0H0jest „alternatywą”. Dopiero konotacje wynikające ze słów „zerowy” i „alternatywny” sprawiają, że wydają się one różne. Można wykazać równoważność w przypadku „Lemmy Neymana Pearsona”, gdy istnieją dwie hipotezy, ponieważ jest to po prostu iloraz prawdopodobieństwa, który jest podawany od razu, biorąc pod uwagę szanse powyższego twierdzenia Bayesa:

P(H0|DI)P(H1|DI)=P(H0|I)P(H1|I)×P(D|H0I)P(D|H1I)=P(H0|I)P(H1|I)×Λ

H0Λ>Λ~Λ~H1L2L1L1L2

Λ1<Λ~1

prawdopodobieństwo prawdopodobieństwa
źródło
3
Ten pierwszy akapit jest parodią klasycznego podejścia do testowania hipotez.
whuber
Testowanie hipotez nie zawsze jest kwestią podjęcia decyzji. Często jest sformułowane jako takie, ale w nauce problemem może być udokumentowanie, że zero jest fałszywe i o ile. Uważam, że gra w słowa przypomina o tym celu. Z tego punktu widzenia brak odrzucenia nie jest decyzją o przyjęciu, ale brakiem dowodów w danych do odrzucenia.
NRH
@NRH - Zgadzam się, ale nie zawsze jest to celem. Jeśli chcesz przetestować nową teorię, chcesz wiedzieć, jak prawdopodobne jest to, że jest ona prawdą, tak samo jak chcesz wiedzieć, jak prawdopodobne jest to, że jest ona fałszywa. I chociaż test hipotezy nie zawsze prowadzi bezpośrednio do decyzji, wydaje się, że marnowanie czasu na zawracanie go w celu przetestowania, jeśli ostatecznie nie doprowadzi do podjęcia decyzji. W rzeczywistości już formułujesz decyzję w swoim komentarzu: „postępuj tak, jakby zerowy parametr był fałszywy”. Jest tylko jedna alternatywa: „postępuj tak, jakby null był prawdziwy”. Jeśli istnieje więcej niż jedna alternatywa, wówczas hipoteza ...
prawdopodobieństwo jest
(kont.) .. test nie został dobrze zdefiniowany i jest „matematycznie źle postawiony”, że tak powiem. Może być duża niepewność co do tej decyzji, ale nie ma innych alternatyw, zero nie może być ani prawdziwe, ani fałszywe jednocześnie, chyba że masz źle postawiony / niejednoznaczny problem. Ale w tym przypadku testowanie hipotez jest bezcelowe - nie można wyciągnąć właściwego wniosku.
prawdopodobieństwo prawdopodobieństwo
(kontynuując rant) - a jeśli celem jest po prostu kwantyfikacja dowodów względem wartości zerowej, nie potrzebujesz testu hipotez. Do tego służy wartość p - nie musisz akceptować ani odrzucać, po prostu zgłoś jej wartość.
prawdopodobieństwo prawdopodobieństwo
1

Hipoteza zerowa powinna zasadniczo zakładać, że różnice w zmiennej odpowiedzi wynikają wyłącznie z błędu.

Na przykład, jeśli chcesz przetestować wpływ jakiegoś czynnika Ana odpowiedź x, wówczas wartość null to:H.0= Nie ma wpływu Ana odpowiedź x.

Nie odrzucenie tej hipotezy zerowej zostanie zinterpretowane jako:

1) wszelkie różnice xwynikają wyłącznie z błędu, a nie, Alub

2) dane nie są wystarczające do wykrycia różnicy, nawet jeśli istnieje (patrz błąd typu 2 poniżej).

Odrzucenie tej hipotezy zerowej byłoby interpretowane jako hipoteza alternatywna: H.za= Istnieje wpływ Ana odpowiedź x, to prawda.

Błędy typu 1 i typu 2 są związane z zastosowaniem hipotezy zerowej, ale tak naprawdę nie są jej przeznaczeniem. Błąd typu 1 występuje po odrzuceniuH.0choć prawdą jest - to znaczy, że nieprawidłowo zawarcia wpływu Ana xkiedy jeden nie istnieje. Błąd typu 2 występuje, gdy nie uda się odrzucićH.0nawet jeśli jest to fałsz - to znaczy, błędnie wnioskujesz, że nie ma żadnego wpływu Ana, xnawet jeśli taki istnieje.

DQdlM
źródło
1
Trzeci akapit wydaje się sugerować, że brak odrzucenia wartości null oznacza, że ​​wartość null jest prawdziwa, ale najwyraźniej jest to nieprawda: alternatywa może być prawdziwa (i zazwyczaj jest), ale nie różni się wystarczająco od wartości null, aby można ją było wykryć przy użyciu danych.
whuber
@ whuber - dobra uwaga, zmienię odpowiedź, aby to odzwierciedlić
DQdlM,