Obecnie pracuję nad serią modeli szeregów czasowych Poissona, próbując oszacować efekt zmiany sposobu zliczania (przejście z jednego testu diagnostycznego do drugiego), jednocześnie kontrolując inne trendy w czasie (powiedzmy ogólny wzrost w występowanie choroby). Mam dane dla wielu różnych stron.
Chociaż majstrowałem również przy GAM, dopasowałem serię dość podstawowych GLM z trendami czasowymi, a następnie zsumowałem wyniki. Kod tego mógłby wyglądać mniej więcej tak w SAS:
PROC GENMOD data=work.data descending;
model counts = dependent_variable time time*time / link=log dist = poisson;
run;
lub to w R:
glm(counts ~ dependent_variable + time + time*time, family="poisson")
Następnie biorąc te szacunki i łącząc je w różnych witrynach. Sugeruje się również, że próbuję używać mieszanego modelu Poissona z losowym nachyleniem i przechwytywaniem dla każdego miejsca, zamiast łączenia. Zasadniczo miałbyś więc stały efekt zmiennej zależnej, a następnie losowy efekt przechwytywania i czasu (lub idealnie czasu i czasu ^ 2, choć rozumiem, że robi się trochę owłosiony).
Mój problem polega na tym, że nie mam pojęcia, jak dopasować jeden z tych modeli, i wydaje się, że modele mieszane są tam, gdzie dokumentacja każdego staje się nagle bardzo nieprzejrzysta. Czy ktoś ma proste wyjaśnienie (lub kod), jak dopasować to, co chcę dopasować i na co uważać?
g <- lmer(y ~ x + (1+t+I(t^2)|ID), family="poisson")
) zwiększyło czas obliczeń z około 0,75 sekundy do około 11 sekund. Wraz ze wzrostem wielkości próbki prawdopodobnie zwiększa się również czas obliczeń.W SAS:
Ale oczywiście jest wiele opcji, mniej lub bardziej użytecznych, do zabawy.
źródło