Dlaczego konieczny jest test t, skoro mamy test Z?

9

Czy ktoś może wyjaśnić, dlaczego „t” zdarza się? Nauczono mnie używać testu t, gdy nie znasz odchylenia standardowego populacji (tj. Znasz tylko odchylenie standardowe w swojej próbce), ale nie jestem pewien, dlaczego miałoby to różnić się od testu Z .

jasonbogd
źródło
Zaktualizowałem twój tytuł, aby uzyskać odpowiedź na pytanie, które, jak sądzę, zadajesz; nie krępuj się edytować, jeśli źle zrozumiałem
Jeromy Anglim

Odpowiedzi:

3

Nie sądzę, że całkowicie rozumiem twoje pytanie. Czy pytasz, dlaczego miałbyś zastosować test t?

Jeśli rozumiesz, dlaczego miałbyś użyć testu Z, powinieneś dobrze wiedzieć, dlaczego miałbyś użyć testu t. W przypadku dużych próbek test Z i test T powinny dać podobne lub identyczne wyniki. Ale podczas gdy test Z przyjmie rozkład normalny, test t uwzględni niepewność w rozkładzie próbek przy mniejszych rozmiarach próbek.

Benjamin Mako Hill
źródło
3
Hmm, test t zakłada również rozkład normalny. Być może chciałeś powiedzieć, że potrzebujemy mniej informacji o tej dystrybucji.
JohnK
@JohnK Nie wydaje mi się, że sens ma powiedzenie, że test zakłada rozkład w pierwszej kolejności, ale myślę, że Benjamin miał na myśli, że wynik t / statystyki zakłada rozkład T, a nie rozkład Z.
Datoraki,
3

Sam test Z jest tak naprawdę testem prawdopodobieństwa między prawdopodobieństwem przy założeniu hipotezy zerowej a prawdopodobieństwem przy założeniu alternatywnej hipotezy. Zakładając, że leżą u podstaw rozkładów normalnych ze znanymi wariancjami i testujemy tylko środki, algebra upraszcza test Z, który znamy i kochamy (DeGroot 1986, s. 442–447).

Stosując tę ​​samą procedurę maksymalnego prawdopodobieństwa, ale traktując wariancję jako nieznaną, tworzy inną parę prawdopodobieństw i ich stosunek, a uproszczenie algebry daje statystykę: (DeGroot 1986, ss. 485–489). Zmienia się również omawiany rozkład testowy, ponieważ licznik powyższej statystyki jest zwykle rozkładany, , a mianownik jest dystrybuowany jako pierwiastek kwadratowy z kwadratowych normalnych, , który jest pierwiastkiem kwadratowym z losowa zmienna chi-kwadrat. Gosset (Student) pokazał, że jeśli masz zmienną losową:

n(X¯nμ0)Sn2n1
X¯S2
YN(0,1)Zχn2XYZn
wtedy X jest rozkładany z rozkładem ti n stopni swobody.

Tak więc, aby stwierdzić to bez rygoru, test t jest naturalnym wynikiem tego samego procesu współczynnika wiarygodności, który stoi za testem z, gdy sama wariancja danych jest nieznana i jest szacowana na podstawie maksymalnego prawdopodobieństwa.

Avraham
źródło
1
to było bardzo pouczające. Zupełnie zapomniałem, że test t pochodzi z maksymalnego prawdopodobieństwa
Moderat
1

Nie rygorystyczna odpowiedź jest taka, że ​​chcesz użyć testu t, gdy masz małą liczbę próbek ze względu na prawdopodobieństwo, że próbki są niezwykle blisko siebie (w stosunku do faktycznej wariancji populacji). W takim przypadku mianownik we wzorze na statystykę t będzie niezwykle mały, a zatem sama statystyka t będzie niezwykle duża. Tak więc znacznie bardziej prawdopodobne jest uzyskanie dużej wartości dla statystyki t, gdy masz niewielką liczbę próbek, niż w przypadku uzyskania porównywalnie dużej statystyki z, więc potrzebujesz większej wartości, aby odrzucić wartość zerową za pomocą test t niż test z na tym samym poziomie istotności.

Evan Wright
źródło
Uważam ten argument za atrakcyjny, ale po zastanowieniu nie przekonujący. W końcu, jeśli przypadkiem próbki są wyjątkowo daleko od siebie (co powinno się zdarzyć równie łatwo, jak niezwykle blisko), to wydaje się, że ta sama logika doprowadziłaby do przeciwnego wniosku.
whuber
0

Najważniejszym czynnikiem różnicującym jest wielkość próby, z reguły: jeśli jest mniejsze niż należy zastosować test t, w przeciwnym razie test z.n30

Dobry przegląd podstawowych założeń i różnic (i podobieństw) obu testów znajduje się tutaj:
http://www.le.ac.uk/bl/gat/virtualfc/Stats/ttest.html

vonjd
źródło