Założenia wielomianowej regresji logistycznej

Odpowiedzi:

6

Kluczowym założeniem w MNL jest to, że błędy są niezależnie i identycznie dystrybuowane z ekstremalnym rozkładem wartości Gumbela. Problem z testowaniem tego założenia polega na tym, że jest ono a priori . W regresji standardowej dopasowujesz krzywą najmniejszych kwadratów i mierzysz błąd resztkowy. W modelu logit zakładasz, że błąd występuje już w pomiarze punktu i obliczasz funkcję prawdopodobieństwa na podstawie tego założenia.

Ważnym założeniem jest to, że próbka jest egzogenna. Jeśli jest to oparte na wyborach, należy zastosować poprawki.

Jeśli chodzi o założenia dotyczące samego modelu, Train opisuje trzy:

  1. Systematyczna i nieprzypadkowa odmiana smaku.
  2. Proporcjonalne zastępowanie między alternatywami (konsekwencja własności IIA).
  3. Brak szeregowej korelacji w zakresie błędu (dane panelowe).

Pierwsze założenie, którego musisz po prostu bronić w kontekście swojego problemu. Trzeci jest w dużej mierze taki sam, ponieważ terminy błędów są czysto losowe.

λ=1λ=1

Jeśli chodzi o robienie tego w SPSS, nie mogę ci pomóc, oprócz sugerowania używania mlogitpakietu w R. Przepraszam.

gregmacfarlane
źródło
Ponadto model wielomianowy probit daje porównywalne wyniki przy innym zestawie założeń. Dlatego porównanie MNP / MNL może być również cenne.
gregmacfarlane
3

Y

Frank Harrell
źródło
Okazuje się, że nie zawsze jest to do końca prawda. Przeprowadzono (bardzo) ostatnie prace, które pokazują, że można oszacować spójne parametry dla alternatyw, których nigdy nie obserwujesz, pod warunkiem, że dysponujesz pewnymi egzogenicznymi informacjami na temat faktycznej częstotliwości populacji. Ale to wymaga innego estymatora, więc ogólnie masz rację.
gregmacfarlane
1
Wygląda na to, że wzywa się przeora bayesowskiego - nie można się nie zgodzić. Ale bez zewnętrznych informacji nieograniczona wielomianowa logistyka ma bardzo dużo parametrów do oszacowania.
Frank Harrell,
2

gmacfarlane było bardzo jasne. Aby być bardziej precyzyjnym i zakładam, że przeprowadzasz analizę przekroju, podstawowym założeniem jest IIA (niezależność nieistotnych alternatyw). Nie możesz wymusić dopasowania danych do założenia IIA, powinieneś je przetestować i mieć nadzieję, że się spełni. Spss z pewnością nie poradziłby sobie z testem do 2010 roku. R oczywiście to robi, ale może mi być łatwiej migrować do stata i wdrożyć testy IIA dostarczone przez polecenia postestimation mlogit.

Jeśli IIA nie obowiązuje, logit wielomianowy mieszany lub logit zagnieżdżony są rozsądnymi alternatywami. Pierwszy można oszacować w gllamm, drugi z dużo bardziej oszczędnym poleceniem nlogit.

JDav
źródło