Recenzent zapytał mnie, czy przedstawione w tabeli korelacje Pearsona (wartości r) można ze sobą porównać, aby można było twierdzić, że jedna jest „silniejsza” od drugiej (inna niż tylko sprawdzenie rzeczywistych wartości r) .
Jak byś to zrobił? Znalazłem tę metodę
http://vassarstats.net/rdiff.html
ale nie jestem pewien, czy to dotyczy.
correlation
pearson-r
method-comparison
pecorino
źródło
źródło
Odpowiedzi:
(Zakładam, że mówisz o r uzyskanych z próbki.)
Test na tej stronie ma zastosowanie w tym sensie, że traktuje r jak każdy parametr, którego wartość może różnić się między dwiema populacjami. Jak to R każdy różni się od wszelkich innych środków, takich jak średnia, który jesteś bardzo pewny siebie w porównaniu z wykorzystaniem t -test? Cóż, różni się tym, że jest związany między -1,1, nie ma właściwego rozkładu, więc musisz przekształcić Fishera przed dokonaniem wnioskowania (i później przekształcić go później, jeśli chcesz np. Uzyskać CI). Wynik Z wynikający z testu ma odpowiednią formę do wnioskowania. Właśnie do tego prowadzi test, do którego się łączysz.
Więc łączysz się z procedurą wnioskowania, co mogłoby się zdarzyć, gdybyś mógł uzyskać r dla całej populacji (populacji), z której próbkujesz - czy r dla jednej grupy byłoby wyższe niż dla drugiej, czy też są dokładnie takie same? Nazwijmy to późniejszą hipotezą H0 . Jeśli test zwraca niską wartość p , oznacza to, że w oparciu o próbkę powinieneś mieć małe zaufanie do hipotezy, że prawdziwa wartość różnicy między dwoma wartościami r wynosi dokładnie 0 (ponieważ takie dane występowałyby rzadko, gdyby różnica w r wynosiła dokładnie 0). Jeśli nie, nie masz danych, aby z pewnością odrzucić tę hipotezę o dokładnie równym r , ponieważ jest to prawda i / lub ponieważ twoja próbka jest niewystarczająca. Zauważ, że mogłem zrobić tę samą historię o różnicy w środkach (za pomocą testu t ) lub innej miary.
Zupełnie innym pytaniem jest, czy różnica między nimi byłaby znacząca . Niestety nie ma jednoznacznej odpowiedzi na to pytanie i żaden test statystyczny nie może dać odpowiedzi. Być może prawdziwa wartość (wartość populacji, a nie ta, którą obserwujesz) r wynosi 0,5 w jednym, a 0,47 w drugiej grupie. W tym przypadku statystyczna hipoteza ich równoważności (nasze H0 ) byłoby fałszywe. Ale czy to znacząca różnica? To zależy - czy coś rzędu 3% więcej wyjaśnionej wariancji jest znaczące, czy bez znaczenia? Cohen podał przybliżone wytyczne dotyczące interpretacji r (i przypuszczalnie różnice między r ), ale zrobił to tylko pod warunkiem, że są one jedynie punktem wyjścia. I nawet nie znasz dokładnej różnicy, nawet jeśli wnioskujesz, np. Obliczając CI dla różnic między dwiema korelacjami. Najprawdopodobniej zakres możliwych różnic będzie zgodny z Twoimi danymi.
Stosunkowo bezpiecznym zakładem byłoby obliczenie przedziałów ufności dla twoich r i ewentualnie CI dla ich różnicy, i pozwolenie czytelnikowi zdecydować.
źródło