Jakie są właściwe założenia wielomianowej regresji logistycznej? A jakie są najlepsze testy, aby spełnić te założenia przy użyciu SPSS 18?
Jakie są właściwe założenia wielomianowej regresji logistycznej? A jakie są najlepsze testy, aby spełnić te założenia przy użyciu SPSS 18?
Kluczowym założeniem w MNL jest to, że błędy są niezależnie i identycznie dystrybuowane z ekstremalnym rozkładem wartości Gumbela. Problem z testowaniem tego założenia polega na tym, że jest ono a priori . W regresji standardowej dopasowujesz krzywą najmniejszych kwadratów i mierzysz błąd resztkowy. W modelu logit zakładasz, że błąd występuje już w pomiarze punktu i obliczasz funkcję prawdopodobieństwa na podstawie tego założenia.
Ważnym założeniem jest to, że próbka jest egzogenna. Jeśli jest to oparte na wyborach, należy zastosować poprawki.
Jeśli chodzi o założenia dotyczące samego modelu, Train opisuje trzy:
Pierwsze założenie, którego musisz po prostu bronić w kontekście swojego problemu. Trzeci jest w dużej mierze taki sam, ponieważ terminy błędów są czysto losowe.
Jeśli chodzi o robienie tego w SPSS, nie mogę ci pomóc, oprócz sugerowania używania mlogit
pakietu w R. Przepraszam.
źródło
gmacfarlane było bardzo jasne. Aby być bardziej precyzyjnym i zakładam, że przeprowadzasz analizę przekroju, podstawowym założeniem jest IIA (niezależność nieistotnych alternatyw). Nie możesz wymusić dopasowania danych do założenia IIA, powinieneś je przetestować i mieć nadzieję, że się spełni. Spss z pewnością nie poradziłby sobie z testem do 2010 roku. R oczywiście to robi, ale może mi być łatwiej migrować do stata i wdrożyć testy IIA dostarczone przez polecenia postestimation mlogit.
Jeśli IIA nie obowiązuje, logit wielomianowy mieszany lub logit zagnieżdżony są rozsądnymi alternatywami. Pierwszy można oszacować w gllamm, drugi z dużo bardziej oszczędnym poleceniem nlogit.
źródło