Tło: Przeczytałem jeden artykuł, w którym autorzy podają korelację Pearsona 0,754 z wielkości próby 878. Wynikowa wartość p dla testu korelacji jest znacząca dla „dwóch gwiazdek” (tj. P <0,01). Myślę jednak, że przy tak dużej próbce odpowiadająca jej wartość p powinna być mniejsza niż 0,001 (tj. Znacząca trzy gwiazdki).
- Czy wartości p dla tego testu można obliczyć tylko na podstawie współczynnika korelacji Pearsona i wielkości próbki?
- Jeśli tak, jak to zrobić w R?
hypothesis-testing
correlation
p-value
fraud
Miroslav Sabo
źródło
źródło
Odpowiedzi:
Tak, można to zrobić, jeśli użyjesz transformacji F-to-z Fishera. Inne metody (np. Bootstrap) mogą mieć pewne zalety, ale wymagają oryginalnych danych. W R ( r jest współczynnikiem korelacji próbki, n jest liczbą obserwacji):
Zobacz także ten post na moim blogu .
To powiedziawszy, czy to .01 czy .001 nie ma aż tak wielkiego znaczenia. Jak powiedziałeś, jest to głównie funkcja wielkości próby i już wiesz, że wielkość próby jest duża. Logiczny wniosek jest taki, że prawdopodobnie wcale nie potrzebujesz testu (zwłaszcza nie jest to test tak zwanej „zerowej” hipotezy, że korelacja wynosi 0). Dzięki N = 878 możesz być całkowicie pewny precyzji szacunku i skupić się na jego bezpośredniej interpretacji (tj. Czy 0,75 jest duży w twojej dziedzinie?).
Formalnie jednak, kiedy przeprowadzasz test statystyczny w ramach Neyman-Pearson, musisz wcześniej określić poziom błędu. Tak więc, jeśli wyniki testu naprawdę mają znaczenie, a badanie zaplanowano z 0,01 jako progiem, sensowne jest jedynie raportowanie p <.01 i nie powinieneś oportunistycznie ustawiać go na p <0,001 na podstawie uzyskanej wartości p . Ten rodzaj nieujawnionej elastyczności jest nawet jednym z głównych powodów krytyki małych gwiazd i, bardziej ogólnie, sposobu, w jaki testowanie znaczenia zerowej hipotezy jest praktykowane w naukach społecznych.
Zobacz także Meehl, PE (1978). Teoretyczne zagrożenia i tabelaryczne gwiazdki: Sir Karl, Sir Ronald i powolny postęp miękkiej psychologii. Journal of Consulting and Clinical Psychology, 46 (4), 806-834. (Tytuł zawiera odniesienie do tych „gwiazd”, ale treść jest znacznie szerszą dyskusją na temat roli testu istotności.)
źródło
Istnieje alternatywna statystyka:
który ma rozkład t z n-2 stopniami swobody. Tak to działa na przykład: http://www.danielsoper.com/statcalc3/calc.aspx?id=44
źródło