Właśnie zdałem sobie sprawę, że zawsze działałem problem regresji, w którym zmienne niezależne były zawsze numeryczne. Czy mogę zastosować regresję liniową w przypadku, gdy wszystkie zmienne niezależne są kategoryczne?
źródło
Właśnie zdałem sobie sprawę, że zawsze działałem problem regresji, w którym zmienne niezależne były zawsze numeryczne. Czy mogę zastosować regresję liniową w przypadku, gdy wszystkie zmienne niezależne są kategoryczne?
Tylko trochę semantyki i dla jasności:
Zatem w większości sytuacji rodzaj regresji zależy od typu zmiennej zależnej, wyniku lub „ ” . Na przykład regresja liniowa jest stosowana, gdy zmienna zależna jest ciągła, regresja logistyczna, gdy zależna jest kategoryczna z 2 kategoriami, oraz regresja multinomi (n) al, gdy zależna jest kategoryczna z więcej niż 2 kategoriami. Predyktory mogą być dowolne (nominalne lub porządkowe jakościowe, ciągłe lub mieszane) .
(Poniższa uwaga może być dla ciebie zbędna, ale i tak ją dodaję)
Należy jednak pamiętać, że większość oprogramowania wymaga przekodowania predyktorów jakościowych do binarnego systemu numerycznego . Oznacza to po prostu kodowanie płci na 0 dla kobiet i 1 dla mężczyzn lub odwrotnie. W przypadku zmiennych kategorialnych z więcej niż 2 poziomami musisz przekodować je na zmienne obojętne gdzie jest liczbą poziomów, a te manekiny zawierają 0 lub 1, gdy należą do odpowiedniej kategorii. W ten sposób każda osoba (próbka) powinna być reprezentowana przez posiadanie 1 dla zmiennej fikcyjnej, której jest częścią i 0 dla pozostałych lub 0 dla wszystkich manekinów, gdy jest on częścią grupy odniesienia.