chl wspominał już o pułapce wielokrotnych porównań przeprowadzając jednocześnie 25 testów z tym samym zestawem danych. Łatwym sposobem na poradzenie sobie z tym jest dostosowanie progu wartości p przez podzielenie ich przez liczbę testów (w tym przypadku 25). Bardziej precyzyjna formuła jest następująca: Skorygowana wartość p = 1 - (1 - wartość p) ^ (1 / n). Jednak te dwa różne wzory wyprowadzają prawie taką samą skorygowaną wartość p.
Jest jeszcze jeden poważny problem z testowaniem hipotez. Z całą pewnością napotkasz błąd typu I (fałszywie dodatni), w wyniku którego odkryjesz bardzo trywialne różnice, które są niezwykle istotne na poziomie 99,9999%. Dzieje się tak dlatego, że gdy mamy do czynienia z próbką o tak dużym rozmiarze (n = 1 313 662), otrzymamy standardowy błąd, który jest bardzo bliski 0. To dlatego, że pierwiastek kwadratowy z 1 313 662 = 1146. Odchylenie standardowe podzielisz przez 1,146. Krótko mówiąc, uchwycisz drobne różnice, które mogą być całkowicie nieistotne.
Sugerowałbym odejście od tej struktury testowania hipotez i zamiast tego przeprowadzenie analizy typu efektu wielkości. W tych ramach miarą odległości statystycznej jest odchylenie standardowe. W przeciwieństwie do błędu standardowego, odchylenie standardowe nie jest sztucznie zmniejszane przez wielkość próbki. Takie podejście pozwoli lepiej zrozumieć istotne różnice między zestawami danych. Wielkość efektu jest również znacznie bardziej skoncentrowana na przedziale ufności wokół średniej średniej różnicy, co jest znacznie bardziej pouczające niż testowanie hipotez koncentruje się na istotności statystycznej, która często wcale nie jest znacząca. Mam nadzieję, że to pomaga.
Studenta t -Dystrybucja staje się bliżej i bliżej rozkładu normalnego jako stopni swobody uzyskać większe. Przy 1313662 + 38704 - 2 = 1352364 stopni swobody, rozkład t będzie nie do odróżnienia od standardowego rozkładu normalnego, jak widać na poniższym obrazku (chyba że jesteś w skrajnym ogonie i jesteś zainteresowany odróżniając absolutnie małe wartości p od jeszcze mniejszych). Możesz więc użyć tabeli dla standardowego rozkładu normalnego zamiast tabeli dla rozkładu t .
źródło
Rozkład tendencję do rozkładu (gaussowskiego), gdy jest duże (w rzeczywistości, gdy , są prawie identyczne, patrz zdjęcie dostarczone przez @onestop). W twoim przypadku powiedziałbym, że jest BARDZO duże, więc możesz po prostu użyć testu- . W wyniku wielkości próby wszelkie BARDZO niewielkie różnice zostaną uznane za znaczące. Warto więc zadać sobie pytanie, czy te testy (z pełnym zestawem danych) są naprawdę interesujące.z n n > 30 n zt z n n>30 n z
Dla pewności, ponieważ zestaw danych zawiera 25 zmiennych, wykonujesz 25 testów? W takim przypadku prawdopodobnie trzeba poprawić wiele porównań, aby nie zawyżać wskaźnika błędów typu I (patrz pokrewny wątek na tej stronie).
BTW, oprogramowanie R daje wartości p, których szukasz, nie musisz polegać na tabelach:
źródło
Możesz użyć następującej funkcji pytona, którą napisałem, która może obliczyć efekt rozmiaru. Test jest tutaj prosty
źródło