Kendall Tau czy rho Spearmana?

69

W jakich przypadkach należy preferować jedno nad drugim?

Znalazłem kogoś, kto twierdzi z korzyścią dla Kendall, z powodów pedagogicznych , czy są jeszcze inne powody?

Tal Galili
źródło
Zobacz także powiązane pytanie stats.stackexchange.com/q/18112/3277 .
ttnphns
1
Niestety link w twoim pytaniu jest martwy. Zakładam, że masz na myśli Noether (2007, Teaching Statistics ) . Czy chcesz go edytować?
Stephan Kolassa

Odpowiedzi:

40

Odkryłem, że korelacja Spearmana jest najczęściej stosowana zamiast zwykłej korelacji liniowej podczas pracy z wynikami o wartościach całkowitych w skali pomiarowej, gdy ma umiarkowaną liczbę możliwych wyników lub gdy nie chcemy polegać na założeniach o relacjach dwuwariantowych . W porównaniu ze współczynnikiem Pearsona interpretacja tau Kendalla wydaje mi się mniej bezpośrednia niż interpretacja rho Spearmana, w tym sensie, że kwantyfikuje różnicę między% par zgodnych i niezgodnych między wszystkimi możliwymi zdarzeniami parami. W moim rozumieniu tau Kendalla bardziej przypomina Goodmana-Kruskala Gamma .

Właśnie przejrzałem artykuł od Larry'ego Winnera w J. Statistics Educ. (2006), który omawia użycie obu miar, wyniki wyścigu NASCAR Winston Cup Race 1975-2003 .

Znalazłem również odpowiedź @onestop na temat korelacji Pearsona lub Spearmana z nietypowymi danymi interesującymi pod tym względem.

Warto zauważyć, że tau Kendalla ( wersja a ) ma połączenie z D Somersa (i C Harrella) stosowanym do modelowania predykcyjnego (patrz np. Interpretacja D Somersa pod czterema prostymi modelami autorstwa RB Newsona i odnośnikiem 6 oraz artykuły Newsona opublikowany w Stata Journal 2006). Przegląd testów suma rang znajduje się w „ Skutecznym obliczaniu przedziałów ufności Jackknife dla statystyki rang” , opublikowanym w JSS (2006).

chl
źródło
Dzięki chl za odpowiedź, zaakceptowałem ją za sam jej zakres. Najlepszy, Tal
Tal Galili
Spearman zastosowany na dwóch zmiennych całkowitych regularnie porównuje więzi, które wydają się być lepiej obsługiwane przez tau Kendalla.
vinnief
29

Odnoszę zaszczytne pan do mojej poprzedniej odpowiedzi : „... przedziały ufności dla Spearmana r S są mniej pewne i mniej niż interpretacji przedziałów ufności dla τ-parametry Kendall”, zgodnie z Kendall & Gibbons (1990).

jeden przystanek
źródło
1
Myślę, że podziękowania należą się Rogerowi Newsonowi, bo właśnie cytuję z jego artykułu.
onestop
22

Znów odpowiedź nieco filozoficzna; podstawowa różnica polega na tym, że Rho Spearmana jest próbą rozszerzenia idei R ^ 2 (= „wyjaśnienie wariancji”) na interakcje nieliniowe, podczas gdy Tau Kendalla ma raczej służyć jako statystyka testowa dla testu korelacji nieliniowej. Tak więc Tau należy stosować do testowania korelacji nieliniowych, Rho jako rozszerzenie R (lub dla osób znających R ^ 2 - wyjaśnianie Tau niczego nie podejrzewającym odbiorcom w ograniczonym czasie jest bolesne).


źródło
6
czy mógłbyś wyjaśnić „interakcje nieliniowe”. Wygląda na to, że Spearman Rho odzwierciedla miarę ważności pod względem psychometrii. Nie wiem o naturze Tau.
Subhash C. Davar,
Nie rozumiem psychometrii twojego komentarza.
Léo Léopold Hertz -
1
„interakcje nieliniowe”, ponieważ liczy się tylko uporządkowanie, a nie korelacja liniowa. Na przykład, i mają Pearsona korelacji 0 podczas tau Kendall lub Rho Spearmana będzie miał wynik 1.x 2xx2
Yohan Obadia
1
Jest to prawdą tylko wtedy, gdy x jest nieujemne.
aocall
17

Oto cytat z Andrew Gilpin (1993) opowiadający się za τ Kendalla nad ρ Spearmana z powodów teoretycznych:

„[ Kendalla zbliża się do rozkładu normalnego szybciej niż , ponieważ zwiększa wielkość próbki; a jest również łatwiejsze do obliczenia matematycznego, szczególnie gdy występują więzi”. τρNτ

Odniesienie

Gilpin, AR (1993). Tabela konwersji Tau Kendalla na Rho Spearmana w kontekście miar wielkości efektu dla metaanalizy. Pomiary edukacyjne i psychologiczne, 53 (1), 87-92.

Nick Stauner
źródło
3

FWIW, cytat z Myers & Well (projekt badawczy i analizy statystyczne, drugie wydanie, 2003, s. 510). Jeśli nadal zależy ci na wartościach p;

Seigel i Castellan (1988, statystyki nieparametryczne dla nauk behawioralnych) zwracają uwagę, że chociaż i Spearman będą ogólnie mieć różne wartości, gdy zostaną obliczone dla tego samego zestawu danych, gdy testy istotności dla i Spearman są oparte na ich rozkłady próbkowania dadzą te same wartości p .τρτρ

Burak Aydin
źródło
Czy wiesz, czy oferują wsparcie dla tego roszczenia? Nie rozumiem, jak to może być ogólnie prawdą (mogą być dość podobne, ale tak naprawdę nie rozumiem, w jaki sposób może podtrzymać się twierdzenie, że będą tacy sami). [Zastanawiam się, czy Siegel i Castellan naprawdę powiedzieli dokładnie to, czy coś nieco innego.]
Glen_b 12.04.16
Sprawdziłem Siegel i Castellan (2ed p253). Mówią coś nieco innego ... ale w rzeczywistości jest to nieco gorsze niż powyższa parafraza, nawet z dodaniem „w przybliżeniu” (gorzej, ponieważ ograniczają to do zera, ale ponieważ są uzależnione od danych to nie pomoże. W każdym razie dla ustalonego rzędu wszystkie możliwe rzędy są równie prawdopodobne pod H0). Fakt, że myślą, że uzależnienie od zera po uzależnieniu od danych ma znaczenie, jest niepokojący. Zastanawiam się, czy mieli zamiar powiedzieć coś jeszcze, czy naprawdę źle zrozumielixy
Glen_b 13.04.16
Jako kontrprzykład weź n = 7 i dokładne wartości p. Niech x = 1,2,3,4,5,6,7 i niech y = 2,1,4,3,7,6,5 ... włócznik daje p = 0,048, Kendall daje 0,136 ... wcale nie tak samo. Inne ustawienie daje tę samą wartość dla Kendalla, ale spearman ma p = 0,302. Istnieje wiele takich przykładów i różnych wielkości próbek
Glen_b 13.04.16
3
Oto wykres przypadku n = 8. Jak widać, istnieje duża zmienność między wartościami p dla dwóch miar korelacji: i.stack.imgur.com/5JMbj.png ... Mogę napisać pytania i odpowiedzi na ten temat
Glen_b
1
Oto dwa przykładowe zestawy danych (po uszeregowaniu), które pokazują dwa przypadki (tym razem z n = 9), w których wartości p korelacji Spearmana są takie same, ale wartości p korelacji Kendalla są całkiem różne: i.stack.imgur. com / 3ILD8.png
Glen_b