Czy ktoś może wyjaśnić, dlaczego „t” zdarza się? Nauczono mnie używać testu t, gdy nie znasz odchylenia standardowego populacji (tj. Znasz tylko odchylenie standardowe w swojej próbce), ale nie jestem pewien, dlaczego miałoby to różnić się od testu Z .
hypothesis-testing
t-test
jasonbogd
źródło
źródło
Odpowiedzi:
Nie sądzę, że całkowicie rozumiem twoje pytanie. Czy pytasz, dlaczego miałbyś zastosować test t?
Jeśli rozumiesz, dlaczego miałbyś użyć testu Z, powinieneś dobrze wiedzieć, dlaczego miałbyś użyć testu t. W przypadku dużych próbek test Z i test T powinny dać podobne lub identyczne wyniki. Ale podczas gdy test Z przyjmie rozkład normalny, test t uwzględni niepewność w rozkładzie próbek przy mniejszych rozmiarach próbek.
źródło
Sam test Z jest tak naprawdę testem prawdopodobieństwa między prawdopodobieństwem przy założeniu hipotezy zerowej a prawdopodobieństwem przy założeniu alternatywnej hipotezy. Zakładając, że leżą u podstaw rozkładów normalnych ze znanymi wariancjami i testujemy tylko środki, algebra upraszcza test Z, który znamy i kochamy (DeGroot 1986, s. 442–447).
Stosując tę samą procedurę maksymalnego prawdopodobieństwa, ale traktując wariancję jako nieznaną, tworzy inną parę prawdopodobieństw i ich stosunek, a uproszczenie algebry daje statystykę: (DeGroot 1986, ss. 485–489). Zmienia się również omawiany rozkład testowy, ponieważ licznik powyższej statystyki jest zwykle rozkładany, , a mianownik jest dystrybuowany jako pierwiastek kwadratowy z kwadratowych normalnych, , który jest pierwiastkiem kwadratowym z losowa zmienna chi-kwadrat. Gosset (Student) pokazał, że jeśli masz zmienną losową:
Tak więc, aby stwierdzić to bez rygoru, test t jest naturalnym wynikiem tego samego procesu współczynnika wiarygodności, który stoi za testem z, gdy sama wariancja danych jest nieznana i jest szacowana na podstawie maksymalnego prawdopodobieństwa.
źródło
Nie rygorystyczna odpowiedź jest taka, że chcesz użyć testu t, gdy masz małą liczbę próbek ze względu na prawdopodobieństwo, że próbki są niezwykle blisko siebie (w stosunku do faktycznej wariancji populacji). W takim przypadku mianownik we wzorze na statystykę t będzie niezwykle mały, a zatem sama statystyka t będzie niezwykle duża. Tak więc znacznie bardziej prawdopodobne jest uzyskanie dużej wartości dla statystyki t, gdy masz niewielką liczbę próbek, niż w przypadku uzyskania porównywalnie dużej statystyki z, więc potrzebujesz większej wartości, aby odrzucić wartość zerową za pomocą test t niż test z na tym samym poziomie istotności.
źródło
Najważniejszym czynnikiem różnicującym jest wielkość próby, z reguły: jeśli jest mniejsze niż należy zastosować test t, w przeciwnym razie test z.n 30
Dobry przegląd podstawowych założeń i różnic (i podobieństw) obu testów znajduje się tutaj:
http://www.le.ac.uk/bl/gat/virtualfc/Stats/ttest.html
źródło