Nieistotny efekt interakcji w zastosowanej ekonometrii (wielomianowa regresja logitowa)

4

Obecnie piszę pracę magisterską, w której stosuję wielomianową regresję logitową z efektem interakcji.

Model, którego używam, jest $$ P (y = j) = exp (xb_j) / (1 + pexp (xb_h)) $$ gdzie $$ xb_j = x_1b_ {ij} + x_2b_ {2j} + x_1x_2b_ {3j} + XB + $$   $ x_1 $ i $ x_2 $ są zmiennymi obojętnymi ($ x_1 $ jest zakodowane 0/1 dla mężczyzny / kobiety).

Używam efektów marginalnych (lub przyrostowych) do raportowania wyników, ponieważ interesuje mnie wpływ zmiany jednostki na prawdopodobieństwo wystąpienia danego wyniku mojej zmiennej y.

Moje pytanie dotyczy moich wyników, gdzie dostaję nieznaczny marginalny wpływ terminu interakcji, co, jak sądzę, wskazuje, że nie ma różnicy między tym, jak mężczyźni i kobiety są dotknięci zmianą jednostki w $ x_2 $. Ale kiedy patrzę osobno na mężczyzn i kobiety, dostaję, że marginalny efekt $ x_2 $ jest znaczący dla mężczyzn ($ frac {częściowo P (y = j)} {częściowy x_2} $, gdy $ x_1 = 0 $ ) i nieistotne dla kobiet ($ frac {częściowo P (y = j)} {częściowe x_2} $, gdy $ x_1 = 1 $). (Używam trzech różnych poziomów istotności (0,1, 0,05 i 0,01))

Jak zinterpretować nieznaczny wpływ interakcji, ale istotny w podgrupie (mężczyźni)?

user2012
źródło
Żeby było jasne: mówisz, że łączysz płeć z inną rzeczą. Dla jasności załóżmy, że ta druga rzecz to wysiłek i że zmienną zależną jest płaca. W tych kategoriach mówisz, że sam wysiłek jest znaczący w płacach, ale interakcja kobiet i wysiłku jest nieznaczna, podczas gdy interakcja mężczyzn i wysiłku jest znacząca?
123
Dla uproszczenia myślę, że można tak powiedzieć. Mimo że zmienna była tylko interakcyjna z kobietą i uzyskuję średni efekt marginalny, ponieważ jest to model nieliniowy. Kiedy uzyskuję średni efekt zmiany w x $ 2 $, jest to znaczące (zarówno kobiety, jak i mężczyźni). Kiedy uzyskuję średni marginesowy efekt zmiany w x x 2 $ dla kobiet (x x 1 = 1 $), jest on nieznaczny i kiedy wyprowadzam średni marginalny efekt mężczyzn ($ x 1 = 0 $) to jest znaczący. Następnie, kiedy czerpię efekt interakcji, który jest różnicą między mężczyznami a kobietami, jest on nieznaczny.
user2012
Efekt interakcji jest wyprowadzany jako (w kategoriach przyrostowych): $$ frac {Delta P (y = j)} {Delta x_ {1} x_ {2}} = lewe [varLambda z lewej (b_ {1 } + b_ {2} + b_ {3} + XB + epson po prawej) - varLambda po lewej (b_ {2} + XB + epson po prawej) right] - left [varLambda left (b_ {1 } + XB + epson right) - varLambda left (XB + epsil right) right] $$ gdzie $$ varLambda left (x ^ {'} beta right) = P (y = j) = exp (xb_ {j}) / (1+ sum exp (xb_ {h})) $$ Powyższe pochodzi z artykułu »Testowanie hipotez dotyczących warunków interakcji w modelach nieliniowych« z Greene (2010)
user2012

Odpowiedzi:

0

Nie jest w 100% jasne, jaką procedurę zastosowałeś do testów podgrup, więc omówię kilka zasad. Poniżej proponuję testy eksploracyjne, aby lepiej zrozumieć wyniki. Logika tej odpowiedzi jest taka sama jak w modelu liniowym.

Jeśli bierzesz wyniki z pojedynczego modelu i wykonujesz testy post hoc współczynników, upewnij się, że poprawnie interpretujesz model. Ponieważ mężczyźni są ukrytą kategorią odniesienia, stała reprezentuje średnią dla mężczyzn (ceteris paribus), a stała plus b1 to średnia dla kobiet. Podobnie, b2 jest „nachyleniem” mężczyzn względem x2, podczas gdy b2 + b3 jest „nachyleniem” kobiet względem x2. Aby przetestować, czy x2 w ogóle ma znaczenie dla kobiet, musielibyście przetestować b2 i b3 razem.

To powiedziawszy, wydaje mi się, że po uruchomieniu pełnego modelu, uruchomiłeś model osobno dla mężczyzn i kobiet (bez warunków związanych z płcią), aby dalej zbadać. Oto kilka rzeczy do zbadania:

  1. Czym różnią się inne parametry dla mężczyzn i kobiet w oddzielnych modelach od głównego modelu?

    • Czy są podobne szacunki punktów?
    • Czy te same zmienne są istotne?
    • Czy modele mają porównywalne dopasowanie do modelu?
  2. Jakiego rodzaju zmiany masz w swoich danych? Aby to zrozumieć, możesz wykonać analizy opisowe i eksploracyjne.

    • Przedstaw tabelę opisową częstotliwości według płci, x2 i j. Gdyby każda „komórka” utworzona w ten sposób miała dokładnie taką samą liczbę, raczej mało prawdopodobne byłoby uzyskanie rozbieżności między modelami podgrup a modelem pełnym (chyba że procesy generowania danych dla mężczyzn i kobiet są całkowicie różne i / lub tam jest heteroskedastycznością według płci).
      • To znaczy, mam przeczucie, że masz „mikronumeryczność” dla niektórych kobiet w pewnych wynikach, a zatem nie można uzyskać wystarczająco małego standardowego błędu, aby odróżnić termin interakcji.
      • Innym sposobem patrzenia na to jest zrozumienie sfera wspólnego wsparcia dla twojego modelu.
    • Uruchom statystyki opisowe (średnia, SD) na innych zmiennych oddzielnie dla mężczyzn i kobiet i poszukaj rozbieżności. Jeśli istnieją znaczne różnice, może to oznaczać coś innego niż seks, który napędza różnicę i / lub ta kolinearność między tą inną zmienną a płcią komplikuje oszacowanie.
      • Jeśli współzmienne są normalnie rozmieszczone, można przeprowadzić serię testów t, oprócz sprawdzania gałek ocznych. (Jeśli chciałbyś być bardziej formalny w tej kwestii i wziąć pod uwagę testowanie wielu hipotez, możesz robić różne rodzaje kontrole salda , używając zmiennych x do przewidywania płci.)
    • Wykresy obszaru wspólnego wsparcia lub dystrybucji innych zmiennych uzależnionych od płci mogą pomóc w pokazaniu tego, co znajdziesz.

Aby zapisać wyniki, proponuję przedstawić tabelę ze współczynnikami dla pełnego modelu bez interakcji, pełny model z interakcją (pokazujący interakcję nie jest znacząca) oraz modele według płci.

W sekcji dyskusji możesz wspomnieć, że przyjrzałeś się roli terminu interakcji. Możesz pokazać swoje wyniki dotyczące mikronumeryczności i równowagi kowariancji według płci (niezależnie od tego, czy wydają się wyjaśniać problem). Wszystkie są analizami eksploracyjnymi, a więc nie mogą same stać się ostatecznymi wyjaśnieniami. Pomagają one jednak w rozwiązaniu tego, co powinno być zrobione w przyszłych analizach (np. Że potrzebny jest większy N lub że nadpróbkowanie osób w małych komórkach może pomóc, lub znalezienie innych sposobów zwiększenia precyzji modelu).

cactus_pardner
źródło
Bardzo dziękuję za odpowiedź. Używam tylko jednego modelu ze zmienną interakcji. Ponieważ interesują mnie efekty marginalne, które nie są współczynnikami w wielomianowym modelu logitowym (jak w OLS), obliczam efekty krańcowe, które zależą od wszystkich innych zmiennych. Następnie wykonuję testy t na marginalnych efektach, aby sprawdzić, czy są znaczące, czy nie. Zgłaszam marginalne efekty (nie współczynniki) z ich standardowymi błędami.
user2012
Marginalnym efektem zmiany w x2 dla mężczyzn jest: $ left. Frac {Delta P (y = j)} {Delta x_ {2}} right | _ {x_ {1 = 0}} = varLambda po lewej (beta_ {2} + XB po prawej) - varLambda po lewej (XB po prawej) $ Marginalnym efektem zmiany x2 dla kobiet jest: $ left. j)} {Delta x_ {2}} right | _ {x_ {1 = 1}} = varLambda left (B_ {1} + B_ {2} + B_ {3} + XB ) - varLambda left (beta_ {1} + XB right) $
user2012
Odnośnie odpowiedzi 2) Istnieje około 400 mężczyzn i 400 kobiet, a ja wykonałem kilka testów Pearsons chi ^ 2, aby sprawdzić, czy zmienne są niezależne od płci. Odnośnie x2, więcej kobiet niż mężczyzn miało x2 = 1, podczas gdy więcej mężczyzn miało x2 = 0. Ale jeśli chodzi o „mikronumeryczność”, to kiedy mam zmienną x3, gdzie tylko cztery kobiety mają x3 = 1?
user2012