Różnica między testami jednostronnymi a dwustronnymi?

13

Studiując kurs statystyki, starałem się zrozumieć różnicę między testami hipotez jedno- i dwustronnych. W szczególności dlaczego test jednostronny odrzuca wartość zerową, podczas gdy test dwustronny nie?

Przykład:

różnica między testami hipotez jedno- i dwustronnych

Lu Ci
źródło
Pamiętaj, że odrzucasz tylko na określonym poziomie istotności. Nadal możesz odrzucić obie hipotezy, podnosząc poziom istotności do 10%. nie odrzuciłbyś obu, jeśli obniżysz poziom istotności do 1%.
probabilityislogic

Odpowiedzi:

11

Dwustronne testy testowe dla różnicy w obu kierunkach. Zatem wartość P byłaby obszarem pod rozkładem t na prawo od t = 1,92 PLUS obszarem pod rozkładem na lewo od t = -1,92. To dwa razy więcej pola niż jednostronny test, więc wartość P jest dwa razy większa.

Jeśli użyjesz testu jednostronnego, zyskasz moc, ale potencjalnym kosztem konieczności zignorowania różnicy, która jest w przeciwnym kierunku niż hipoteza przed uzyskaniem danych. Jeśli masz dane przed sformalizowaniem i zarejestrowaniem hipotezy, naprawdę powinieneś zastosować test dwustronny. Podobnie, jeśli byłbyś zainteresowany efektem w obu kierunkach, użyj testu dwustronnego. W rzeczywistości możesz zastosować test dwustronny jako podejście domyślne i zastosować test jednostronny tylko w nietypowym przypadku, w którym efekt może istnieć tylko w jednym kierunku.

Michael Lew
źródło
Dziękuję za komentarz, Michael. Oto, czego nie rozumiem: jak obszar pod krzywą może być dwa razy większy w przypadku testu dwustronnego? Czy P nie powinno być takie samo w obu przypadkach, ponieważ alfa = 0,05?
Lu Ci
alfa, w twoim pytaniu, jest tylko punktem odcięcia dla podjęcia decyzji o tym, co oznacza p (odrzuć zero lub nie). Zatem nie wpływa to na wartość p.
John
Nieco wybredna, ale nie trzeba koniecznie wybierać hipotezy przed zobaczeniem danych. Możesz wykonać dwustronne testy. Zawsze odrzucisz kierunek, który nie sprzyja dane. Dlatego sensowne jest przejście do testu jednostronnego, który jest preferowany przez dane.
probabilislogiczny
1
@probabilityislogic-całkowicie się zgadzam, z wyjątkiem sytuacji, gdy chce się, aby wartość alfa odzwierciedlała faktyczny długoterminowy poziom fałszywie dodatnich błędów (tj. ktoś chce zastosować podejście Neymana-Pearsona). Jeśli użyjesz testu jednostronnego i na podstawie obserwowanego efektu zdecydujesz o kierunku zmiany, to uzyskasz dokładnie dwa razy więcej wyników fałszywie dodatnich, niż wynikałoby to z twojego poziomu alfa.
Michael Lew
Jest to tylko długoterminowy poziom błędu dla kogoś, kto ciągle ignoruje poprzednie dane. To nie jest dobry sposób na osiągnięcie dobrej wydajności w długim okresie. wskaźnik błędu podany przez istotność dotyczy wszystkich zestawów danych, które mogliśmy zaobserwować raz .
probabilityislogic
5

Pole pod krzywą nie jest dwukrotnie większe dla testu dwustronnego: W przypadku testu dwustronnego z krytycznym p = 0,05 testujesz, jak często obserwowane dane mogą być rysowane z dolnej lub górnej 2,5% rozkładu zerowego ( W sumie 0,05). Za pomocą testu 1-ogonowego testujesz, jak często dane pochodzą z ekstremalnego 5% ogona jednego (wcześniej określonego) ogona.

Częściowo odpowiedzią na twoje pytanie jest praktyka: większość badaczy uważa eksperymenty raportujące jednostronne testy za mało prawdopodobne do powtórzenia (tj. Zakładają, że badacz wybrał to, aby ich statystyki były „znaczące”).

Istnieją jednak ważne przypadki użycia. Jeśli wiesz, że jakikolwiek wynik w odwrotnym kierunku jest niemożliwy zgodnie z testowaną teorią, to, jak zauważono w poprzednim komentarzu, możesz to określić z wyprzedzeniem i przeprowadzić test jednostronny. Większość ludzi, znowu, postrzegałaby to ostrożnie.

tim
źródło
1

S(D)RR

S(D)=|t||t|>t0t0αS(D)=tt>t1t1Pr(|t|>t0|H0)Pr(t>t0|H0)t0t1

To prowadzi do pytania: po co używać różnych statystyk testowych? Powodem jest to, że alternatywy są różne, a zatem siła każdej statystyki testowej jest inna. W szczególności moc każdego testu jest zmniejszona (pod warunkiem, że używamy tego samego znaczenia), jeśli użyjemy statystyki testu i regionu odrzucenia z drugiego testu.

prawdopodobieństwo prawdopodobieństwa
źródło