to jest mój pierwszy post. Jestem naprawdę wdzięczny za tę społeczność.
Usiłuję analizować dane zliczania wzdłużnego, które są obcinane przez zero (prawdopodobieństwo, że zmienna odpowiedzi = 0 wynosi 0), a średnia! = Wariancja, więc wybrano ujemny rozkład dwumianowy nad poissonem.
Funkcje / polecenia, które wykluczyłem:
R
- Funkcja gee () w R nie uwzględnia skracania zera ani ujemnego rozkładu dwumianowego (nawet przy załadowanym pakiecie MASS)
- glm.nb () w R nie pozwala na różne struktury korelacji
- vglm () z pakietu VGAM może korzystać z rodziny posnegbinomial, ale ma ten sam problem, co polecenie ztnb Staty (patrz poniżej), ponieważ nie mogę ponownie modelować przy użyciu niezależnej struktury korelacji.
Stata
- Gdyby dane nie były podłużne, mógłbym po prostu użyć pakietów Stata ztnb do uruchomienia mojej analizy, ALE to polecenie zakłada, że moje obserwacje są niezależne.
Wykluczyłem również GLMM z różnych przyczyn metodologicznych / filozoficznych.
Na razie zdecydowałem się na komendę Stata xtgee (tak, wiem, że xtnbreg robi to samo), która uwzględnia zarówno niezależne struktury korelacji, jak i ujemną dwumianową rodzinę, ale nie obcinanie zera. Dodatkową korzyścią wynikającą z używania xtgee jest to, że mogę również obliczyć wartości qic (za pomocą polecenia qic) w celu ustalenia najlepiej dopasowanych struktur korelacji dla moich zmiennych odpowiedzi.
Jeśli istnieje pakiet / polecenie w R lub Stata, które mogą wziąć pod uwagę 1) rodzinę dwumianową, 2) GEE i 3) obcinanie zera, chciałbym wiedzieć.
Byłbym bardzo wdzięczny za wszelkie twoje pomysły. Dziękuję Ci.
-Casey
źródło
gamlss
pakiecie, która może pasować również do rachunku w R.Hmm, dobre pierwsze pytanie! Nie znam pakietu, który spełnia Twoje dokładne wymagania. Myślę, że xtgee Staty jest dobrym wyborem, jeśli określisz również
vce(robust)
opcję podania standardowych błędów Huber-White, lubvce(bootstrap)
jeśli jest to praktyczne. Każda z tych opcji zapewni konsekwentne szacowanie standardowych błędów, pomimo błędnej specyfikacji modelu, ignorując zerowe obcięcie.Pozostawia to pytanie, jaki wpływ zignorowanie skrótu zerowego będzie miało na interesujące cię oszacowanie punktu. Warto szybko poszukać, czy istnieje ogólna literatura na ten temat, tj. Niekoniecznie w kontekście GEE - pomyślałbym, że można całkiem bezpiecznie założyć, że wszelkie takie wyniki będą miały znaczenie również w przypadku GEE. Jeśli nic nie możesz znaleźć, zawsze możesz symulować dane z zerowym obcięciem i znanymi oszacowaniami efektu, a także oszacować odchylenie poprzez symulację.
źródło
W mojej rozprawie miałem ten sam problem. W Stacie właśnie zbudowałem własny program .ado z dwoma wywołaniami do xtgee.
W tym celu znalazłem slajdy / programy „Modelowanie kosztów opieki zdrowotnej i rachunków” autorstwa Partha Deb, Willard Manning i Edwarda Nortona. Nie mówią o danych podłużnych, ale jest to przydatny punkt wyjścia.
źródło
Szukałem odpowiedzi na interpretację glmmADMB i widziałem twój post. Wiem, że to było dawno temu, ale mogę znać odpowiedź.
Zajrzyj do pakietu glmmADMB, gdy używasz modeli przeszkodowych. Musisz podzielić na dwie analizy swoich danych: jedna z nich traktuje tylko dane zerowe. Możesz dodać mieszane efekty i wybrać rozkład. Warunkiem jest to, że dane muszą być zerowane i nie wiem, czy to spełniło twoje wymagania! W każdym razie mam nadzieję, że dowiedziałeś się dawno temu!
źródło