Klastrowe błędy standardowe a modelowanie wielopoziomowe?

18

Przejrzałem kilka książek (Raudenbush i Bryk, Snijders i Bosker, Gelman & Hill itp.) Oraz kilka artykułów (Gelman, Jusko, Primo i Jacobsmeier itp.), I nadal nie zawinąłem głowy główne różnice między używaniem klastrowanych błędów standardowych i wielopoziomowego modelowania.

Rozumiem części, które muszą mieć do czynienia z pytaniem badawczym; istnieją pewne rodzaje odpowiedzi, które można uzyskać tylko dzięki modelowaniu wielopoziomowemu. Jednak na przykład w przypadku modelu dwupoziomowego, w którym współczynniki zainteresowania znajdują się tylko na drugim poziomie, jaka jest przewaga wykonywania jednej metody nad drugą? W tym przypadku nie martwię się o prognozowanie lub wyodrębnianie indywidualnych współczynników dla klastrów.

Główną różnicą, jaką udało mi się znaleźć, jest to, że standardowe błędy klastrowe cierpią, gdy klastry mają nierówne rozmiary próbek, a modelowanie wielopoziomowe jest słabe, ponieważ zakłada specyfikację losowego rozkładu współczynników (podczas gdy stosowanie klastrowanych błędów standardowych jest wolne od modelu) .

I w końcu, czy to wszystko oznacza, że ​​w przypadku modeli, które mogłyby pozornie stosować dowolną metodę, powinniśmy otrzymywać podobne wyniki pod względem współczynników i błędów standardowych?

Wszelkie odpowiedzi lub pomocne zasoby byłyby bardzo mile widziane.

RickyB
źródło
6
użytkownik Stask ma fajną odpowiedź na dokładnie to pytanie .
Andy W
Dzięki. Przeczytałem to wcześniej, co tak naprawdę sceptycznie podniosło rzeczywiste korzyści. Wydaje mi się jednak, że prawdziwą motywacją mojego pytania jest sprawdzenie, czy w ogóle jestem uzasadniony, sądząc, że nie jest to zbyt przydatne, jeśli patrzę tylko na współczynniki drugiego poziomu jako interesujące. Ponadto być może mi tego brakowało, ale nie sądzę, aby ten post dotyczył tego, czy te dwie metody powinny dawać podobne wyniki (gdy spełnione są założenia obu metod).
RickyB
1
Przez „współczynniki na drugim poziomie” masz na myśli poziom, na którym ci parametry pierwszego etapu jako zmienne zależne?
sheß
Tak, o to mi chodzi.
RickyB,

Odpowiedzi:

1

Ten post opiera się na osobistych doświadczeniach, które mogą być specyficzne dla moich danych, więc nie jestem pewien, czy kwalifikuje się jako odpowiedź.

Jeśli to możliwe, sugeruję użycie symulacji, aby ocenić, która metoda najlepiej sprawdza się w przypadku danych. Zrobiłem to i byłem zaskoczony, gdy stwierdziłem, że testy (dotyczące parametrów na pierwszym poziomie) oparte na modelowaniu wielopoziomowym przewyższają każdą inną metodę (pod względem mocy), zachowując rozmiar nawet w małych próbkach z kilkoma „klastrami” o nierównej wielkości. Mam jeszcze znaleźć artykuł, który o tym mówi, a z tego, co widzę, nie jest to naprawdę niszowy temat i zasługuje na większą uwagę. Wydaje mi się, że nie do końca zbadano, w jaki sposób różne metody porównują się ze skończoną próbką lub kilkoma / nierównymi klastrami.

sheß
źródło
Dziękuję za Twój komentarz. Czy zdarza ci się mieć dokument, w którym zapisałeś swoje wyniki? Byłbym bardzo zainteresowany spojrzeniem na to i zobaczeniem tego, co znalazłeś (i, oczywiście, nie cytowałem, nie udostępniłem ani nie poprawiłem tego bez dyskusji z tobą).
RickyB,