Regresja z tylko zmiennymi kategorycznymi

24

Czy można przeprowadzić regresję, jeśli wszystkie zmienne zależne i niezależne są zmiennymi kategorialnymi?

altruista
źródło
3
Z pewnością jest to możliwe, nawet w przypadku regresji zwykłej lub ogrodowej, o ile zmienna odpowiedzi (zależna) jest traktowana wyłącznie numerycznie. W zależności od oprogramowania może być konieczne naciśnięcie lub wymuszenie tego. Dzięki odpowiednio szerokiej definicji regresji, obejmującej regresję logistyczną lub porządkową, jest to nie tylko możliwe, ale również powszechne.
Nick Cox

Odpowiedzi:

31

Musimy jasno sprecyzować nasze warunki tutaj, ale ogólnie tak :

  • Jeśli twoja zmienna zależna jest ciągła (a reszty są normalnie rozłożone - patrz tutaj ), ale wszystkie twoje zmienne niezależne są kategoryczne, jest to po prostu ANOVA .
  • Jeśli twoja zmienna zależna jest jakościowa, a zmienne niezależne są ciągłe, byłaby to regresja logistyczna (w zależności od tego binarna, porządkowa lub wielomianowa ).
  • Jeśli zarówno zmienna zależna, jak i zmienne niezależne są zmiennymi kategorialnymi, nadal możesz użyć regresji logistycznej - jest to rodzaj LR w wersji ANOVA.

Zauważ, że zarówno regresja logistyczna, jak i zwykła regresja najmniejszych kwadratów (liniowa) są szczególnymi przypadkami Uogólnionego Modelu Liniowego .

gung - Przywróć Monikę
źródło
Jest to trzeci przypadek, o którym wspomniałeś, próbowałem LR, żaden ze współczynników nie był znaczący. Myślałem, że robię coś złego.
altruist
2
Nie sądzę ANOVA wymaga zmienną zależną ciągły dłużej niż wymaga zwykle rozproszone resztki. Są to tylko warunki, w których oczekuje się, że ANOVA będzie działać dobrze.
Nick Cox
1
@NickCox, oczywiście masz rację; spieramy się o to, jak zdefiniujemy i zastosujemy te warunki. Powiedziałbym, że model wywodzi się z tych założeń, ale ANOVA może być stosowana nawet wtedy, gdy nie są one spełnione, w / w zależności od tego, czy wyniki będą pomocne.
gung - Przywróć Monikę
1
@altruist, przedstawiłem trzy przypadki dla jasności pojęciowej; Rozumiem, że ostatni jest tym, czego chcesz. Pamiętaj, że to, czy używasz oprogramowania poprawnie, aby dopasować go do modelu i czy twoje współczynniki są „znaczące”, nie ma związku z tym, czy LR jest odpowiednim modelem dla twojej sytuacji.
gung - Przywróć Monikę
4
Zauważ, że kategoryczność jest czasem kwestią definicji oprogramowania, a czasem w umyśle obserwatora. Jaka jest na przykład liczba dzieci?
Nick Cox,