Wybieranie między testem i testem

20

Tło: Przedstawiam kolegom w pracy prezentację na temat testowania hipotez i rozumiem większość z nich dobrze, ale jest jeden aspekt, który wiążę się w węzły, próbując zrozumieć i wyjaśnić innym.

Tak myślę, że wiem (proszę poprawić, jeśli źle!)

  • Statystyki, które byłyby normalne, gdyby wariancja była znana, postępuj zgodnie z rozkładem jeśli wariancja jest nieznanat
  • CLT (Central Limit Theorem): rozkład próbkowania średniej próbki jest w przybliżeniu normalny dla wystarczająco dużego (może wynosić , może być do dla silnie wypaczonych rozkładów)30 300n30300
  • Rozkład można uznać za normalny dla stopni swobody> 30t>30

Skorzystać z -test jeżeli:z

  1. Populacja normalna i znana wariancja (dla dowolnej wielkości próby)
  2. Populacja normalna, wariancja nieznana in (z powodu CLT)n>30
  3. Dwumian populacji, ,n q > 10np>10nq>10

Używasz testu jeśli:t

  1. Populacja normalna, wariancja nieznana inn<30
  2. Brak wiedzy na temat populacji lub wariancji in , ale dane próbki wyglądają normalnie / pomyślnie przechodzą testy itp., Więc populację można uznać za normalnąn<30

Pozostały mi więc:

  • Dla próbek i (?), Brak wiedzy o populacji i wariancji znanych / nieznanych.< 300>30<≈300

Więc moje pytania to:

  1. Przy jakiej wielkości próby można założyć (w przypadku braku wiedzy o rozkładzie populacji lub wariancji), że rozkład średniej próby jest normalny (tj. Uruchomił się CLT), gdy rozkład próby wygląda nienormalnie? Wiem, że niektóre dystrybucje potrzeba , ale niektóre środki zdają się mówić używać -test gdy ...z n > 30n>300zn>30

  2. W przypadkach, których nie jestem pewien, zakładam, że sprawdzam dane pod kątem normalności. Teraz, jeśli przykładowe dane wyglądają normalnie, czy używam testu (ponieważ zakładam, że populacja jest normalna, a ponieważ )?zn>30

  3. Co z tym, gdzie przykładowe dane dla przypadków, których nie jestem pewien, nie wyglądają normalnie? Czy są jakieś okoliczności, w których nadal używałbyś testu lub testu czy zawsze starasz się przekształcić / zastosować testy nieparametryczne? Wiem, że ze względu na CLT przy pewnej wartości rozkład próbkowania średniej będzie zbliżony do normy, ale dane próbki nie powiedzą mi, co to jest wartość ; dane próbki mogą być nienormalne, podczas gdy średnia próbki jest zgodna z normą / . Czy istnieją przypadki, w których transformowałbyś / stosowałeś test nieparametryczny, podczas gdy w rzeczywistości rozkład próbkowania średniej był normalny / ale nie mogłeś powiedzieć? z n n t ttznntt

Hatti
źródło
4
może być do 300 dla bardzo wypaczonych dystrybucji ”… w niektórych przypadkach może być o wiele więcej; lub może się nigdy nie zdarzyć. Wybierz dowolne , a pokażę ci przypadek, w którym to nie wystarczy. n
Glen_b
Dzięki Glen_b - więc zawsze sprawdzaj, czy dane przykładowe wyglądają normalnie, aby użyć parametrycznego?
Hatti
@Hatti nope! Test T jest ważny, gdy dane wydają się nienormalne.
AdamO,

Odpowiedzi:

24

@AdamO ma rację, po prostu zawsze używasz testu jeśli nie znasz a-priori odchylenia standardowego populacji. Nie musisz się martwić, kiedy przełączyć się na test- , ponieważ dystrybucja przełącza się za ciebie. Dokładniej, -Dystrybucja zbieżny do normalnej, a tym samym jest to prawidłowy rozdział co do wykorzystania w . tzttNN

Istnieje również zamieszanie co do znaczenia tradycyjnej linii przy . Istnieją dwa rodzaje konwergencji, o których ludzie mówią: N=30

  1. Po pierwsze, rozkład próbkowania statystyki testowej (tj. ) obliczony z normalnie rozłożonych (w obrębie grupy) surowych danych jest zbieżny z rozkładem normalnym jako pomimo faktu, że SD jest szacowany na podstawie danych. ( Dystrybucja zajmuje się tym za Ciebie, jak wspomniano powyżej.) tNt
  2. Drugi jest taki, że rozkład próbkowania średnią niż normalnie rozdzielone (w obrębie grupy) zbieżny surowych danych do rozkładu normalnego (wolniej niż powyżej) w . Ludzie liczą na to, że zajmie się nimi Centralne Twierdzenie Graniczne . Nie ma jednak gwarancji, że zbiega się w granicach rozsądnej próby - na pewno nie ma powodu, aby sądzić, że (lub ) to magiczna liczba. W zależności od wielkości i charakteru nienormalności może to zająć bardzo dużo czasu (por. Odpowiedź Makra tutaj: Regresja, gdy reszty OLS nie są normalnie rozmieszczoneN30 300 U U t30300). Jeśli uważasz, że (w ramach grupy) surowe dane nie są bardzo normalne, może lepiej byłoby użyć innego rodzaju testu, takie jak Mann-Whitney -testU . Zauważ, że przy nietypowych danych test Manna-Whitneya będzie prawdopodobnie silniejszy niż test , i może tak być, nawet jeśli uruchomił się CLT. (Warto również zauważyć, że testowanie normalności może doprowadzić cię na manowce, patrz: czy testowanie normalności jest „zasadniczo bezużyteczne”? )Ut

W każdym razie, aby bardziej precyzyjnie odpowiedzieć na twoje pytania, jeśli uważasz, że twoje (w grupie) surowe dane nie są normalnie rozpowszechniane, skorzystaj z testu Manna-Whitneya ; jeśli uważasz, że Twoje dane są normalnie rozpowszechniane, ale nie znasz a priori SD, skorzystaj z testu ; a jeśli uważasz, że Twoje dane są normalnie dystrybuowane i znasz a priori SD, skorzystaj testu- . Utz

Może pomóc ci przeczytać ostatnią odpowiedź @ GregSnow tutaj: Interpretacja wartości p w porównaniu proporcji między dwiema małymi grupami w R również w odniesieniu do tych kwestii.

gung - Przywróć Monikę
źródło
Dzięki, to było naprawdę pomocne, wiedziałem, że to komplikuję, ponieważ test t dla większych n zbliża się do normy. Tak ściśle mówiąc, nawet jeśli n wynosi 1000, należy zastosować test t, jeśli SD nie jest znana z góry?
Hatti
Nie ma za co. Ściśle mówiąc, tak , ale zauważmy, że bardzo trudno będzie odróżnić rozkład od rozkładu normalnego w tym punkcie. t
Gung - Przywróć Monikę
Tak, zdecydowanie. Przepraszam, że byłem tak wybredny, po prostu trudno jest wymyślić, jak wyjaśnić to innym w dość czarno-biały sposób. Doceń swoją pomoc dzięki!
Hatti
Należy również pamiętać, że obliczanie wyników testu t jest zgodne z wszystkimi celami i celami bez znaczących dodatkowych kosztów obliczeniowych w dzisiejszych czasach. Nie szukamy już statystyk testowych w niektórych papierowych tabelach, które nie mogą obejmować wszystkich przypadków, po prostu pytamy komputer. Po co więc męczyć się i martwić, czy być może uda się uzyskać te same wyniki za pomocą testu Z?
Björn,
11

W tej sprawie nie ma o czym dyskutować. Używać -test zawsze na nieparametrycznego testu różnic w sposób, o ile bardziej wyrafinowany przykład narzędziowego resampling permutacji ładujący, lub jest wymagana (przydatne w bardzo małych próbek o dużych odstępstw od normalności).t

Jeśli stopnie swobody faktycznie mają znaczenie, to test zapewni spójne oszacowanie wartości krytycznych i standardowych błędów dla rozkładu statystyki testowej w ramach hipotezy zerowej. W przeciwnym razie test jest w przybliżeniu taki sam jak test .t zttz

Normalne przybliżenie do testów parametrów modelu parametrycznego, takich jak test proporcji populacji, jest w pewnym sensie nieczynne. Gdy dane są na tyle małe, że naprawdę istnieje różnica między wartościami krytycznymi generowanymi rozkładów lub , naprawdę powinieneś zastosować dokładny test proporcji oparty na skalowanym dwumianowym rozkładzie statystyki testowej. W ten sposób działają również testy ponownego próbkowania. Przyjmowanie arbitralnych założeń dotyczących wielkości próby i częstości przypadków / kontroli w szacowaniu parametrów Bernoulliego jest mylące i bardzo podatne na błędy.ztz

Pojęcie testu- („znanej” wariancji) jest mylące, ponieważ nigdy nie „znamy” wariancji ani nie wydajesz dużo na jej oszacowanie. Gdy ten koszt ma znaczenie, tylko test odzwierciedla jego wpływ na stopnie swobody.tzt

AdamO
źródło
Używaj testu t zawsze do nieparametrycznego testu różnic średnich. Masz na myśli parametryczny, prawda?
Xavier Bourret Sicotte