Model wielopoziomowy a osobne modele dla każdego poziomu

10

Jakie są zalety i wady uruchamiania osobnych modeli w porównaniu z modelowaniem wielopoziomowym?

W szczególności załóżmy, że w badaniu przebadano pacjentów zagnieżdżonych w gabinetach lekarskich zagnieżdżonych w poszczególnych krajach. Jakie są zalety / wady prowadzenia osobnych modeli dla każdego kraju w porównaniu z trójpoziomowym modelem zagnieżdżonym?

Peter Flom
źródło
2
Technicznie potrzebujesz sporo jednostek poziomu 3, jeśli chcesz uzyskać obiektywne oszacowania parametrów w modelu 3-poziomowym (ogólnie mówiąc, wielkość próbki w dowolnym modelu wielopoziomowym jest szczególnie ważna na najwyższym poziomie), więc chyba że masz duża losowa próba krajów (być może 50+), prawdopodobnie powinieneś rozważyć uruchomienie osobnych modeli 2-poziomowych, a jeśli masz kilka krajów, możesz rozważyć traktowanie kraju jako kategorycznego predyktora poziomu 2 w modelu 2-poziomowym
Patrick Coulombe,
Cześć @gung Nie było mnie, teraz na nie spojrzę.
Peter Flom

Odpowiedzi:

6

Pytanie jest przestarzałe, ale myślę, że jest bardzo ważne. Najlepsza odpowiedź, jaką mogę uzyskać, to książka Joopa J Hoxa (2010) „Techniki i aplikacje analizy wielopoziomowej, wydanie drugie”.

pq

Zwykły model regresji jednopoziomowej dla tych samych danych oszacowałby tylko punkt przecięcia, wariancję jednego błędu i nachylenia regresji p + q. Przewaga modelu regresji wielopoziomowej jest oczywista, jeśli weźmiemy pod uwagę, że dane są pogrupowane w grupy. Jeśli mamy 100 grup, oszacowanie zwykłego modelu regresji wielokrotnej w każdej grupie osobno wymaga oszacowania 100 × (1 punkt przechwytywania regresji + 1 różnica wariancji + nachylenie regresji p) plus możliwe interakcje ze zmiennymi q na poziomie grupy. Regresja wielopoziomowa zastępuje oszacowanie 100 punktów przecięcia przez oszacowanie średniego punktu przecięcia plus jego rezydualnej wariancji między grupami, przy założeniu normalnego rozkładu dla tych reszt. A zatem, analiza regresji wielopoziomowej zastępuje oszacowanie 100 oddzielnych punktów przecięcia przez oszacowanie dwóch parametrów (średniej i wariancji punktów przecięcia) plus założenie normalności. To samo uproszczenie stosuje się do stoków regresji. Zamiast szacować 100 nachyleń dla zmiennej objaśniającej płeć ucznia, szacujemy średnie nachylenie wraz z jego wariancją między grupami i zakładamy, że rozkład stoków jest normalny. Niemniej jednak, nawet przy niewielkiej liczbie zmiennych objaśniających, analiza regresji wielopoziomowej implikuje skomplikowany model. Zasadniczo nie chcemy oszacować pełnego modelu, po pierwsze dlatego, że może to doprowadzić nas do problemów obliczeniowych, ale także dlatego, że bardzo trudno jest interpretować tak złożony model.

To jest opis. Teraz strony 29-30 odpowiedzą na twoje pytanie dokładniej.

Przewidywane przecięcia i nachylenia dla 100 klas nie są identyczne z wartościami, które uzyskalibyśmy, gdybyśmy przeprowadzili 100 osobnych analiz regresji zwykłej w każdej z 100 klas, stosując standardowe techniki zwykłych najmniejszych kwadratów (OLS). Gdybyśmy porównali wyniki 100 oddzielnych analiz regresji OLS z wartościami uzyskanymi z analizy regresji wielopoziomowej, stwierdzilibyśmy, że wyniki z oddzielnych analiz są bardziej zmienne. Wynika to z tego, że wielopoziomowe szacunki współczynników regresji dla 100 klas są ważone. Są to tak zwane empiryczne Bayesa (EB) lub oszacowania skurczu: średnia ważona konkretnego oszacowania OLS w każdej klasie i ogólny współczynnik regresji, oszacowany dla wszystkich podobnych klas.

W rezultacie współczynniki regresji są zmniejszane z powrotem do średniego współczynnika dla całego zestawu danych. Masa skurczu zależy od wiarygodności szacowanego współczynnika. Współczynniki oszacowane z małą dokładnością kurczą się bardziej niż bardzo dokładnie oszacowane współczynniki. Dokładność oszacowania zależy od dwóch czynników: wielkości próby w grupie oraz odległości między oszacowaniem opartym na grupie a oszacowaniem ogólnym. Szacunki dla małych grup są mniej wiarygodne i kurczą się bardziej niż szacunki dla dużych grup. Gdy inne rzeczy są równe, szacunki, które są bardzo dalekie od ogólnych oszacowań, są uważane za mniej wiarygodne i kurczą się bardziej niż szacunki zbliżone do ogólnej średniej. Zastosowana metoda statystyczna nazywa się empiryczną estymacją Bayesa. Z powodu tego efektu skurczu empiryczne estymatory Bayesa są stronnicze. Są one jednak zazwyczaj bardziej precyzyjne, właściwość, która często jest bardziej przydatna niż obiektywna (patrz Kendall, 1959).

Mam nadzieję, że to satysfakcjonujące.

Meng Hu
źródło
2

Określenie efektu losowego obejmuje założenie, że średnią tych poziomów są próbki z rozkładu normalnego. Lepiej określić je jako efekty stałe, zmienne obojętne AKA, jeśli to założenie nie pasuje do twoich danych. W ten sposób kontrolujesz heterogeniczność grupową w średniej (na tym poziomie), ale NIE pozwalasz na heterogeniczność w odpowiedziach na zmienne niższego poziomu.

Jeśli oczekujesz heterogeniczności w odpowiedzi na zmienne objaśniające niższego poziomu, sensowne są oddzielne modele, chyba że chcesz uruchomić jakiś model losowego współczynnika (co ponownie zakłada założenie, że współczynniki są normalnie rozkładane).

(Wierzę, że istnieją metody dla nienormalnych efektów losowych, ale nic tak szeroko stosowanego lub dostępnego jak lme)

użytkownik_ogólny
źródło
1

Zaleta: możliwość jawnego testowania różnic parametrów według klastra (tj. Różnice w znaczeniu nie oznaczają znaczących różnic).

DL Dahly
źródło
2
Ta odpowiedź jest zdecydowanie za krótka. Bardziej komentarz niż odpowiedź.
Eric Peterson