Zamieszanie w sprawie kiedy należy używać

15

Odniosłem się do tego wykładu wideo w celu obliczenia przedziału ufności . Mam jednak pewne zamieszanie. Ten facet jest za pomocą -statistics do obliczeń. Myślę jednak, że powinna to być statystyka typu . Nie podano nam prawdziwego odchylenia standardowego populacji. Używamy przykładowego odchylenia standardowego do oszacowania rzeczywistego.zt

Dlaczego więc wziął rozkład normalny dla przedziału ufności zamiastt ?

użytkownik34790
źródło
2
t
Tylko jako punkt odniesienia, wypracowanie problem narażone na wideo z t statystyki przyniósłby: n <- 36; diff <- 12; sd <- 40; 2 * (pt(diff/(sd/sqrt(n)), df = n - 1) - 0.5) = 0.9195145.
Antoni Parellada

Odpowiedzi:

10

Masz rację, powinien to być rozkład T. Ale ponieważ wielkość próbki wynosi 36 (tj.> 20), rozkład az również byłby odpowiedni. Pamiętaj, że wraz ze wzrostem wielkości próbki rozkład t staje się bardziej podobny do kształtu z-rozkładu.

Grayskin
źródło
21

Kiedy wziąłem swój pierwszy kurs statystyczny (po dinozaurach, ale kiedy prawdziwe komputery zajmowały cały pokój) uczono nas używania stołu Z, jeśli było więcej niż 30 stopni swobody, częściowo dlatego, że stół T w książce wzrósł tylko do 30 stopni swobody, a jeśli spojrzysz na stół t, zobaczysz, że gdzieś w okolicach 28 stopni swobody uzyskasz takie same wyniki jak stół z do 2 cyfr znaczących (a robiąc to wszystko ręcznie, mieliśmy tendencję częściej zaokrąglać). Być może prezenter nadal jest w tej szkole.

Masz rację, jeśli używasz przykładowego odchylenia standardowego do testu, oznacza to, że naprawdę powinieneś używać rozkładu t niezależnie od wielkości (co jest znacznie łatwiejsze do zrobienia w tych dniach) i używać z (standardowej normalnej) tylko wtedy, gdy znać odchylenie standardowe populacji, ale dla celów praktycznych często nie zobaczysz znaczącej różnicy, jeśli wielkość próby jest duża.

Greg Snow
źródło
1
Wielka anegdota :)
swiecki
Jednym niefortunnym skutkiem ubocznym tego, że czasami jest OK, aby używać przedziałów Z jest to, że niektóre teksty wprowadzające przedstawiają przedziały Z zamiast przedziałów T. Istnieje wiele dziedzin nauki, w których próbki są rutynowo wystarczająco małe, aby odstępy Z były całkowicie nieodpowiednie. Mówię o tym moim uczniom co roku, z wyraźnymi instrukcjami, ale wciąż znaczna ich liczba stosuje odstępy Z :-(
Michael Lew
4

Trudno mi ustalić, czy Khan nieco uprościł rzeczy w filmie, czy się nie myli. Muszę powiedzieć to drugie, ale problem nie leży w pytaniu Z lub T. Nazywa to, co oblicza przedział ufności, a następnie mówi, że ma 92% pewności, że średnia populacji mieści się w podanym zakresie. To po prostu nie jest coś, co wyciągasz z przedziału ufności ... niestety.

Więc wracam do pytania t vs. z i zaczynam się zastanawiać, czy popełnił tam błąd. Myślę, że może nie dlatego, że twierdzi, że jeśli próbka jest mniejsza, musisz dokonać korekty. Więc inni odpowiadający prawdopodobnie mają rację. Używa tylko z, ponieważ już go wprowadził i jest wystarczająco blisko z liczbą 36. Nie planuję przejrzeć wszystkich filmów, ale wyobrażam sobie, że wprowadzi dystrybucję t później, mam nadzieję, że następny.

To naprawdę niefortunne, że Khan Academy myli się w wielu obszarach statystyk ... ale może tak się czuję, ponieważ zwracam uwagę tylko na filmy z problemami.

Jan
źródło