Korzystam z modelu regresji Poissona do zliczania danych i zastanawiam się, czy istnieją powody, aby nie używać solidnego standardowego błędu do szacowania parametrów? Jestem szczególnie zaniepokojony, ponieważ niektóre z moich szacunków bez solidnej nie są znaczące (np. P = 0,13), ale z solidną są znaczące (p <0,01).
W SAS jest to dostępne przy użyciu powtarzanej instrukcji w proc genmod
(np repeated subject=patid;
.). Korzystam z http://www.ats.ucla.edu/stat/sas/dae/poissonreg.htm jako przykładu przytaczającego artykuł Camerona i Trivedi (2009) na poparcie stosowania solidnych standardowych błędów.
Będę różnicować analizy za pomocą modelu na podstawie solidnych błędów standardowych, odnosząc się do tych ostatnich jako „GEE”, co w rzeczywistości jest wymienną definicją. Oprócz fantastycznego wyjaśnienia Scortchi:
GEE mogą być „tendencyjne” w małych próbkach, tj. 10–50 pacjentów: (Lipsitz, Laird i Harrington, 1990; Emrich i Piedmonte, 1992; Sharples i Breslow, 1992; Lipsitz i in., 1994; Qu, Piedmonte i Williams, 1994; Gunsolley, Getchell i Chinchilli, 1995; Sherman i le Cessie, 1997.) Kiedy mówię, że GEE są stronnicze, mam na myśli to, że standardowe oszacowanie błędu może być zachowawcze lub antykonserwatywne z powodu małej lub zerowej liczby komórek , w zależności od tego, które dopasowane wartości wykazują takie zachowanie i jak są one zgodne z ogólnym trendem modelu regresji.
Zasadniczo, gdy model parametryczny jest poprawnie określony, nadal otrzymujesz prawidłowe standardowe szacunki błędów z CI opartych na modelu, ale cały sens używania GEE polega na uwzględnieniu tego bardzo dużego „jeśli”. GEE pozwalają statystykowi jedynie określić działający model prawdopodobieństwa danych, a parametry (zamiast interpretować je w ściśle parametrycznym układzie) są uważane za rodzaj „sita”, który może generować powtarzalne wartości bez względu na leżące u ich podstaw, nieznane generowanie danych mechanizm. To serce i dusza analizy półparametrycznej, której przykładem jest GEE.
GEE obsługują również niezmierzone źródła kowariancji danych, nawet ze specyfikacją niezależnej macierzy korelacji. Wynika to z zastosowania raczej empirycznej niż opartej na modelu macierzy kowariancji. Na przykład w modelowaniu Poissona możesz być zainteresowany współczynnikiem dzietności łososia pobranego z różnych strumieni. Komórki jajowe zebrane od samic ryb mogą mieć podstawowy rozkład Poissona, ale zmienność genetyczna, która obejmuje wspólną dziedziczność i dostępne zasoby w określonych strumieniach, może sprawić, że ryby w tych strumieniach będą bardziej podobne niż wśród innych strumieni. GEE poda prawidłowe szacunkowe standardowe błędy populacyjne, o ile częstotliwość próbkowania jest zgodna z ich proporcją populacyjną (lub w inny sposób stratyfikowana).
źródło
Wykonujesz test na zerową równowartość. Jest to prosta pomocnicza regresja OLS. Opis znajduje się na stronie 670 Camerona i Trivedi. W przypadku dużej naddyspersji standardowe błędy są bardzo deflowane, więc byłbym bardzo ostrożny wobec wszelkich wyników, które zależą od niestabilnego VCE, gdy występuje naddyspersja. W przypadku niskiej dyspersji sytuacja będzie odwrotna, co brzmi jak scenariusz, w którym się znajdujesz.
źródło