Czy wartości p dla testu korelacji Pearsona można obliczyć na podstawie współczynnika korelacji i wielkości próby?

Tak, można to zrobić, jeśli użyjesz transformacji F-to-z Fishera. Inne metody (np. Bootstrap) mogą mieć pewne zalety, ale wymagają oryginalnych danych. W R ( r jest współczynnikiem korelacji próbki, n jest liczbą obserwacji):

z <- 0.5 * log((1+r)/(1-r))
zse <- 1/sqrt(n-3)
min(pnorm(z, sd=zse), pnorm(z, lower.tail=F, sd=zse))*2

Zobacz także ten post na moim blogu .

To powiedziawszy, czy to .01 czy .001 nie ma aż tak wielkiego znaczenia. Jak powiedziałeś, jest to głównie funkcja wielkości próby i już wiesz, że wielkość próby jest duża. Logiczny wniosek jest taki, że prawdopodobnie wcale nie potrzebujesz testu (zwłaszcza nie jest to test tak zwanej „zerowej” hipotezy, że korelacja wynosi 0). Dzięki N = 878 możesz być całkowicie pewny precyzji szacunku i skupić się na jego bezpośredniej interpretacji (tj. Czy 0,75 jest duży w twojej dziedzinie?).

Formalnie jednak, kiedy przeprowadzasz test statystyczny w ramach Neyman-Pearson, musisz wcześniej określić poziom błędu. Tak więc, jeśli wyniki testu naprawdę mają znaczenie, a badanie zaplanowano z 0,01 jako progiem, sensowne jest jedynie raportowanie p <.01 i nie powinieneś oportunistycznie ustawiać go na p <0,001 na podstawie uzyskanej wartości p . Ten rodzaj nieujawnionej elastyczności jest nawet jednym z głównych powodów krytyki małych gwiazd i, bardziej ogólnie, sposobu, w jaki testowanie znaczenia zerowej hipotezy jest praktykowane w naukach społecznych.

Zobacz także Meehl, PE (1978). Teoretyczne zagrożenia i tabelaryczne gwiazdki: Sir Karl, Sir Ronald i powolny postęp miękkiej psychologii. Journal of Consulting and Clinical Psychology, 46 (4), 806-834. (Tytuł zawiera odniesienie do tych „gwiazd”, ale treść jest znacznie szerszą dyskusją na temat roli testu istotności.)

Gala
źródło

Prawdopodobnie radziłbym im zrezygnować z małych gwiazdek, nawet jeśli wyniki są prawidłowe, ale rozumiem twój punkt widzenia.

Gala

Zredagowałem swoją odpowiedź, aby dodać uwagę na temat tego problemu. Zauważ, że 0,001 <0,01, więc autorzy są formalnie „poprawni” w każdym przypadku, bardziej zależy to od sposobu, w jaki raportowane są wyniki. Sądzę, że w przeciwieństwie do oczywistego błędu, który recenzent powinien oczywiście poprawić, kwestię tę należy pozostawić autorom.

Gala

Masz rację, ale do tej pory nigdy nie widziałem zgłaszania p <0,01, jeśli p jest faktycznie mniejsze niż 0,001 (nie mówiąc, że poziom ufności dla artykułu wynosi 0,01). Co więcej, w artykule, o którym mówię, autorzy podają 30 testów korelacji opartych na wielkościach prób w zakresie od 837 do 886 z korelacjami w zakresie od 0,145 do 0,754 i wszystkie są przedstawione jako znaczące w dwóch gwiazdkach.

Miroslav Sabo

Mam problem z opublikowaniem tutaj kodu, ale uruchamiam symulacje, a wartość p z twojego kodu nie jest taka sama jak wartość p z cor.test.

Miroslav Sabo

Napisałem samouczek dotyczący użycia Z z Fishera do korelacji dostępny na stata-journal.com/sjpdf.html?articlenum=pr0041 Zalecam częstsze stosowanie przedziałów ufności i obliczyć 0,724, 0,781 jako limity 95%. Poleciłbym jeszcze bardziej przyjrzeć się danym i wypracować regresję.

Nick Cox

Czy wartości p dla testu korelacji Pearsona można obliczyć na podstawie współczynnika korelacji i wielkości próby?

Odpowiedzi: