Współczynniki regresji, czyli pytania o Kronmal

14

Niedawno losowe przeglądanie pytań wywołało wspomnienie podpowiedzi jednego z moich profesorów sprzed kilku lat ostrzegających o stosowaniu współczynników w modelach regresji. Zacząłem więc o tym czytać, prowadząc ostatecznie do Kronmal 1993.

Chcę się upewnić, że poprawnie interpretuję jego sugestie dotyczące sposobu ich modelowania.

  1. Dla modelu o stosunku o tym samym mianowniku zarówno po stronie zależnej, jak i niezależnej:
    Z1Y=Z11nβ0+Z1XβX+βZ+Z1ϵ

    • Zależny od regresji stosunek do (odwrotnej) zmiennej mianownika oprócz innych stosunków
    • Waga według (odwrotnej) zmiennej mianownika
  2. Dla modelu ze zmienną zależną jako stosunek:
    Y=β0+βXX+Z1nα0+ZXαX+Z1ϵ

    • Zresetuj licznik według oryginalnych zmiennych, mianownika i razy mianownika zmiennych pierwotnych [co ze zmiennymi kategorialnymi?]
    • Waga według (odwrotnego) mianownika
  3. Y=β0+XβX+Z11nβZ1+WβW+Z1WβZ1W+ϵ

    • Uwzględnij licznik i (odwrotny) mianownik jako główne efekty, stosunek jako termin interakcji.

Czy moje interpretacje tutaj są poprawne?

Affine
źródło

Odpowiedzi:

1

Powinieneś naprawdę połączyć się z papierem Kronmal (i wyjaśnić swoją notację, która jest zaczerpnięta bezpośrednio z gazety). Twoje czytanie tego dokumentu jest zbyt dosłowne. W szczególności nie udziela porad na temat ważenia, a raczej mówi, że ważenie można wykonać zwykłymi sposobami, więc nie trzeba dyskutować. Jest to wymienione tylko jako możliwość. Przeczytaj swoje przypadki bardziej jak przykłady, zwłaszcza jako przykłady analizy takich sytuacji.

W części 6 podaje kilka ogólnych rad, które przytoczę tutaj:

Przesłaniem tego artykułu jest to, że zmiennych współczynnika należy używać tylko w kontekście pełnego modelu liniowego, w którym uwzględnione są zmienne tworzące stosunek, a także składnik przechwytujący. Powszechna praktyka stosowania współczynników dla zmiennej zależnej lub niezależnej w analizie regresji może prowadzić do wprowadzających w błąd wniosków i rzadko skutkuje jakimkolwiek zyskiem. Ta praktyka jest jednak powszechna i zakorzeniona i może być trudno przekonać niektórych badaczy, że powinni zrezygnować ze swojego najcenniejszego wskaźnika lub indeksu.

W artykule wykorzystano (fikcyjny) przykład Neymana na temat porodów i bocianów. Aby grać z tym przykładem, możesz uzyskać do niego dostęp z R.

data(stork, package="TeachingDemos")

Pozostawiam zabawę czytelnikom, ale jedna interesująca fabuła jest taka coplot:

działka kondycjonująca dla przykładu bocianów Neyman

kjetil b halvorsen
źródło