Pracuję z zestawem danych o wartości N około 200 000. W regresjach widzę bardzo małe wartości istotności << 0,001 związane z bardzo małymi wielkościami efektów, np. R = 0,028. Chciałbym wiedzieć, czy istnieje zasadniczy sposób decydowania o odpowiednim progu istotności w odniesieniu do wielkości próby? Czy istnieją inne ważne uwagi na temat interpretacji wielkości efektu przy tak dużej próbce?
regression
probability
statistical-significance
sample-size
ted.strauss
źródło
źródło
Odpowiedzi:
W „Nieistotności testowania istotności” Johnson (1999) zauważył, że wartości p są arbitralne, ponieważ można je uczynić tak małymi, jak chcesz, gromadząc wystarczającą ilość danych, zakładając, że hipoteza zerowa jest fałszywa, co prawie zawsze jest. W prawdziwym świecie mało prawdopodobne jest, aby korelacje częściowo częściowe miały dokładnie zero, co jest zerową hipotezą w testowaniu istotności współczynnika regresji. Odcięcia istotności wartości p są jeszcze bardziej arbitralne. Wartość 0,05 jako punkt odcięcia między znaczeniem a nieistotnością jest stosowana w konwencji, a nie w zasadzie. Tak więc odpowiedź na twoje pierwsze pytanie brzmi: nie, nie ma zasadniczego sposobu podjęcia decyzji o odpowiednim progu istotności.
Co więc możesz zrobić, biorąc pod uwagę duży zestaw danych? To zależy od twojego (-ych) powodu (-ów) do zbadania istotności statystycznej współczynników regresji. Czy próbujesz modelować złożony system wieloczynnikowy i opracować użyteczną teorię, która w rozsądny sposób pasuje lub przewiduje rzeczywistość? Może więc warto pomyśleć o opracowaniu bardziej złożonego modelu i spojrzeć na niego z perspektywy modelowania, jak opisano w Rodgers (2010), The Epistemology of Mathematical and Statistics Modeling . Zaletą posiadania dużej ilości danych jest możliwość eksploracji bardzo bogatych modeli, z wieloma poziomami i interesującymi interakcjami (zakładając, że masz do tego zmienne).
Jeśli natomiast chcesz dokonać oceny, czy traktować dany współczynnik jako statystycznie istotny, czy nie, możesz przyjąć sugestię Gooda (1982) podsumowaną w Woolley (2003) : Oblicz wartość q jak który standaryzuje wartości p do wielkości próby 100. Wartość p dokładnie 0,001 przekształca się w wartość p 0,045 - statystycznie nadal znacząca.p⋅(n/100)−−−−−−√
Więc jeśli jest to znaczące przy użyciu dowolnego arbitralnego progu lub innego, co z tego? Jeśli jest to badanie obserwacyjne, masz dużo więcej pracy, aby uzasadnić, że ma on naprawdę sens w twoim sposobie myślenia, a nie tylko fałszywy związek, który pojawia się, ponieważ źle określiłeś swój model. Należy zauważyć, że niewielki efekt nie jest tak interesujący klinicznie, jeśli reprezentuje istniejące wcześniej różnice między ludźmi wybierającymi różne poziomy leczenia, a nie efekt leczenia.
Musisz zauważyć, czy relacja, którą widzisz, jest praktycznie znacząca, jak zauważyli komentatorzy. Konwersja liczb, które podajesz z na r 2 dla wyjaśnienia wariancji ( r to korelacja, kwadrat, aby uzyskać wyjaśnienie wariancji) daje odpowiednio 3 i 6% wariancji wyjaśnionej, co nie wydaje się zbyt duże.r r2 r
źródło
Wydaje mi się, że łatwym sposobem na sprawdzenie byłoby losowe pobranie podobnej dużej liczby z tego, co wiesz, że jest to jedna dystrybucja dwa razy i porównanie dwóch wyników. Jeśli zrobisz to kilka razy i zaobserwujesz podobne wartości p, sugeruje to, że nie ma realnego efektu. Jeśli z drugiej strony nie, to prawdopodobnie jest.
źródło