W przypadku testów t, zgodnie z większością tekstów, zakłada się, że dane populacji są zwykle rozłożone. Nie rozumiem, dlaczego tak jest. Czy test t nie wymaga jedynie, aby rozkład próbkowania średnich próbek był normalnie rozłożony, a nie populacja?
Jeśli jest tak, że test t ostatecznie ostatecznie wymaga normalności w rozkładzie próbkowania, populacja może wyglądać jak dowolny rozkład, prawda? Tak długo, jak istnieje rozsądna wielkość próby. Czy to nie to, co stwierdza centralne twierdzenie graniczne?
(Mam tu na myśli testy t dla jednej próbki lub niezależnych próbek)
Odpowiedzi:
Statystyka t składa się ze stosunku dwóch wielkości, obu zmiennych losowych. Nie składa się tylko z licznika.
Aby statystyka t miała rozkład t, nie wystarczy, że średnia próbki ma rozkład normalny. Potrzebujesz również:
aby w mianowniku były takie, że *s s2/σ2∼χ2d
aby licznik i mianownik były niezależne.
* (wartość zależy od tego, który test - w jednej próbce mamy )d t d=n−1
Aby te trzy rzeczy były rzeczywiście prawdziwe, potrzebujesz, aby oryginalne dane były zwykle dystrybuowane.
Przyjrzyjmy się przez chwilę. Aby CLT mógł utrzymać populację, musi spełniać warunki ... - populacja musi mieć rozkład, do którego ma zastosowanie CLT. Więc nie, ponieważ istnieją rozkłady populacji, do których CLT nie ma zastosowania.
Nie, CLT tak naprawdę nie mówi ani słowa o „rozsądnej wielkości próby”.
W rzeczywistości nic nie mówi o tym, co dzieje się przy dowolnej skończonej wielkości próbki.
Myślę teraz o konkretnej dystrybucji. Jest to taki, do którego CLT z pewnością ma zastosowanie. Ale przy rozkład średniej próbki jest wyraźnie nienormalny. Wątpię jednak, aby jakakolwiek próbka w historii ludzkości zawierała w sobie tyle wartości. Więc - poza tautologią - co oznacza „rozsądny ”?n=1015 n
Masz więc dwa problemy:
A. Efekt, który ludzie zwykle przypisują CLT - coraz bardziej bliskie podejście do normalności rozkładów średnich próbek przy małych / średnich rozmiarach próbek - nie jest tak naprawdę stwierdzony w CLT **.
B. „Coś, co nie jest tak dalekie od normy w liczniku”, nie wystarcza, aby uzyskać statystykę o rozkładzie T.
** (Coś w rodzaju twierdzenia Berry'ego-Esseena bardziej przypomina to, co ludzie widzą, gdy patrzą na wpływ zwiększenia wielkości próby na rozkład średnich próbek).
CLT i twierdzenie Słuckiego razem dają (o ile utrzymują wszystkie ich założenia), że od rozkład statystyki t zbliża się do normy normalnej. Nie mówi, czy dany skończony może być wystarczający do jakiegoś celu.n→∞ n
źródło