Korelacja Spearmana lub Pearsona ze skalami Likerta, w których można naruszyć liniowość i homoscedastyczność

9

Chcę przeprowadzić korelacje na wielu pomiarach, w których zastosowano skale Likerta. Patrząc na wykresy rozrzutu, wydaje się, że założenia liniowości i homoscedastyczności mogły zostać naruszone.

  • Biorąc pod uwagę, że wydaje się, że istnieje pewna debata wokół skalowania poziomu porządkowego zbliżającego się do skalowania poziomu interwału, czy powinienem grać w nim bezpiecznie i używać Rho Spearmana zamiast r Pearsona?
  • Czy istnieje odniesienie, które mogę zacytować, jeśli pójdę z Spearman's Rho?
Whuber
źródło

Odpowiedzi:

13

Poprzednie odpowiedzi na tej stronie:

Podobne pytania zadano kilka razy na tej stronie. Sprawdzić

Skale kontra przedmioty:

Z mojego doświadczenia wynika, że ​​istnieje różnica między przeprowadzaniem analiz dla podobnego elementu, a nie w skali likerta. Skala Likerta jest sumą wielu pozycji. Po zsumowaniu wielu elementów skale Likerta uzyskują więcej możliwych wartości, skala wynikowa jest mniej nierówna. Takie skale często mają wystarczającą liczbę punktów, że wielu badaczy jest gotowych traktować je jako ciągłe. Oczywiście niektórzy twierdzą, że jest to nieco nonszalanckie, a w psychometrii napisano wiele o tym, jak najlepiej mierzyć konstrukty psychologiczne i pokrewne.

Standardowa praktyka w naukach społecznych:

Z moich przypadkowych spostrzeżeń z czytania artykułów z psychologii wynika, że ​​większość dwuwymiarowych związków między wielopunktowymi skalami Likerta jest analizowana przy użyciu współczynnika korelacji Pearsona. Tutaj myślę o skalach takich jak osobowość, inteligencja, postawy, samopoczucie i tak dalej. Jeśli masz takie skale, warto wziąć pod uwagę, że twoje wyniki zostaną porównane z poprzednimi wynikami, w których Pearson mógł być dominującym wyborem.

Porównaj metody:

Jest to interesujące ćwiczenie w porównaniu Pearsona z Spearmanem (a może nawet tau Kendalla). Jednak nadal pozostaje Ci decyzja, której statystyki użyć, a to ostatecznie zależy od tego, jaką masz definicję powiązania dwuwariantowego.

Heteroscedastyczność

Współczynnik korelacji jest dokładnym podsumowaniem liniowej zależności między dwiema zmiennymi, nawet przy braku homoscedastyczności (a może powinniśmy powiedzieć normalność dwuwymiarową, biorąc pod uwagę, że żadna zmienna nie jest zmienną zależną).

Nieliniowość

Jeśli istnieje nieliniowa zależność między dwiema zmiennymi, jest to interesujące. Obie zmienne można jednak nadal traktować jako zmienne ciągłe, a zatem nadal można używać Pearsona. Na przykład wiek często ma odwróconą zależność U od innych zmiennych, takich jak dochód, a mimo to wiek jest zmienną ciągłą.

Sugeruję, aby stworzyć wykres rozproszenia i dopasować niektóre wygładzone pasowania (takie jak splajn lub LOESS), aby zbadać wszelkie relacje nieliniowe. Jeśli relacja jest naprawdę nieliniowa, to korelacja liniowa nie jest najlepszym wyborem do opisania takiej relacji. Następnie możesz zbadać regresję wielomianową lub nieliniową.

Jeromy Anglim
źródło
1
+1 za podkreślenie różnicy między przedmiotami Likerta a skalami Likerta.
ThomasH
2

Prawie na pewno powinieneś wybrać rho Spearmana lub tau Kendalla. Często, jeśli dane są nienormalne, ale wariancje są równe, możesz wybrać r Pearsona, ponieważ nie robi to ogromnej różnicy. Jeśli wariancje są znacząco różne, potrzebujesz metody nieparametrycznej.

Prawdopodobnie mógłbyś zacytować prawie każdy podręcznik do statystyk wprowadzających, aby poprzeć korzystanie ze Spearman's Rho.

Aktualizacja: jeśli założenie liniowości zostanie naruszone, nie powinieneś używać współczynnika korelacji Pearsona w swoich danych, ponieważ zakłada on zależność liniową. Rho Spearmana jest akceptowalne bez liniowości i jest przeznaczone do bardziej ogólnych monotonicznych związków między zmiennymi. Jeśli chcesz użyć współczynnika korelacji Pearsona, możesz spojrzeć na log przekształcający twoje dane, ponieważ może to poradzić sobie z nieliniowością.

richiemorrisroe
źródło
-1

jedno jest pewne, że korelacja wymaga ogólnie liniowości w związku. teraz mówisz, że twoje dane mają nieco kształt krzywej, więc regresja nieliniowa wydaje się być lewym wyborem

THIRTHAALA NAAGA SAAYI KUMAAR
źródło
6
Nie wydaje mi się, żeby to było „całkiem pewne”. Jedynie korelacja Pearsona jest miarą liniowości; Być może główną kwestią związaną z innymi rodzajami korelacji jest to, że mają bardziej zrelaksowane wyobrażenia o tym, co w relacjach liczy się jako doskonałość.
Nick Cox,