Krótkie podsumowanie
Dlaczego regresja logistyczna (z ilorazami szans) jest częściej stosowana w badaniach kohortowych z wynikami binarnymi, w przeciwieństwie do regresji Poissona (z względnym ryzykiem)?
tło
Z mojego doświadczenia wynika, że statystyki licencjackie i magisterskie oraz kursy epidemiologiczne na ogół uczą, że do modelowania danych z wynikami binarnymi należy stosować regresję logistyczną, a oszacowania ryzyka należy podawać jako iloraz szans.
Jednak regresji Poissona (i pokrewnych: quasi-Poissona, dwumianu ujemnego itp.) Można również użyć do modelowania danych z wynikami binarnymi, a odpowiednimi metodami (np. Solidny estymator wariancji kanapkowej) zapewnia prawidłowe szacunki ryzyka i poziomy ufności. Na przykład,
- Greenland S., Szacunkowa ocena ryzyka względnego i innych miar epidemiologicznych w oparciu o model w badaniach wspólnych wyników oraz w badaniach kontrolnych przypadków , Am J Epidemiol. 15 sierpnia 2004; 160 (4): 301-5.
- Zou G., Zmodyfikowane podejście regresji Poissona do badań prospektywnych z danymi binarnymi , Am J Epidemiol. 1 kwietnia 2004 r .; 159 (7): 702–6.
- Zou GY i Donner A., Rozszerzenie zmodyfikowanego modelu regresji Poissona na badania prospektywne ze skorelowanymi danymi binarnymi , Stat Methods Med Res. 8 listopada 2011 r.
Z regresji Poissona można zgłaszać ryzyko względne, które zdaniem niektórych jest łatwiejsze do interpretacji w porównaniu ze współczynnikami prawdopodobieństwa, szczególnie w przypadku częstych wyników, a zwłaszcza przez osoby bez silnego doświadczenia w statystyce. Zobacz Zhang J. i Yu KF, Jakie jest względne ryzyko? Metoda korekcji ilorazu szans w badaniach kohortowych wspólnych wyników , JAMA. 18 listopada 1998; 280 (19): 1690-1.
Z lektury literatury medycznej wynika, że wśród badań kohortowych z wynikami binarnymi wydaje się, że o wiele bardziej powszechne jest zgłaszanie ilorazów szans z regresji logistycznych niż względnego ryzyka z regresji Poissona.
pytania
W przypadku badań kohortowych z wynikami binarnymi:
- Czy istnieje uzasadniony powód, aby zgłaszać iloraz szans z regresji logistycznych zamiast ryzyka względnego z regresji Poissona?
- Jeśli nie, to czy rzadką regresję Poissona przy względnym ryzyku w literaturze medycznej można przypisać głównie opóźnieniu między teorią metodologiczną a praktyką wśród naukowców, klinicystów, statystów i epidemiologów?
- Czy pośrednie statystyki i kursy epidemiologiczne powinny zawierać więcej dyskusji na temat regresji Poissona dla wyników binarnych?
- Czy powinienem zachęcać studentów i współpracowników do rozważenia regresji Poissona zamiast regresji logistycznej, gdy jest to właściwe?
exp(beta_M1) =/= 1/exp(beta_M2)
). To mnie trochę niepokoi.Odpowiedzi:
Odpowiedź na wszystkie cztery pytania, poprzedzona notatką:
W rzeczywistości współczesne badania epidemiologiczne nie są tak częste, aby zgłaszać iloraz szans z regresji logistycznej dla badania kohortowego. Pozostaje techniki regresji wyboru badań kliniczno-kontrolnych, ale bardziej wyrafinowane techniki są teraz de facto standardem dla analizy w głównych czasopismach epidemiologicznych jak Epidemiology , AJE lub IJE. Pojawi się większa tendencja do pojawiania się w czasopismach klinicznych informujących o wynikach badań obserwacyjnych. Pojawią się również problemy, ponieważ regresję Poissona można zastosować w dwóch kontekstach: o czym mówisz, w którym zastępuje model regresji dwumianowej oraz w kontekście czasu do zdarzenia, który jest niezwykle powszechny w grupie studia. Więcej szczegółów w poszczególnych odpowiedziach na pytania:
W przypadku badania kohortowego nie do końca nie. Istnieją pewne bardzo specyficzne przypadki, w których można powiedzieć, że użyto częściowego modelu logistycznego, ale są to wartości odstające. Cały sens badania kohortowego polega na tym, że możesz bezpośrednio zmierzyć względne ryzyko lub wiele powiązanych miar i nie musisz polegać na ilorazie szans. Zrobię jednak dwie notatki: regresja Poissona często szacuje tempo, a nie ryzyko, a zatem oszacowanie efektu na podstawie tego często będzie odnotowane jako współczynnik szybkości (głównie, moim zdaniem, więc nadal można go skrócić RR) lub współczynnik gęstości padania (IRR lub IDR). Upewnij się więc, że faktycznie szukasz właściwych terminów: istnieje wiele badań kohortowych z wykorzystaniem metod analizy przeżycia. Dla tych badań regresja Poissona przyjmuje pewne problematyczne założenia, w szczególności, że zagrożenie jest stałe. W związku z tym znacznie częściej analizuje się badanie kohortowe przy użyciu proporcjonalnych modeli zagrożeń Coxa, a nie modeli Poissona, i podaje wynikający z tego współczynnik ryzyka (HR). Gdybym naciskał, aby nazwać „domyślną” metodę analizy kohorty, powiedziałbym, że epidemiologia jest faktycznie zdominowana przez model Coxa. Ma to swoje własne problemy i niektórzy bardzo dobrzy epidemiolodzy chcieliby to zmienić,
Są dwie rzeczy, które można przypisać do sporadyczność - rzadko zjawisko niekoniecznie mam myśleć istnieje w stopniu sugerować. Jednym z nich jest to, że tak - „epidemiologia” jako dziedzina nie jest dokładnie zamknięta i otrzymujesz ogromną liczbę artykułów od klinicystów, naukowców społecznych itp., A także epidemiologów o różnym pochodzeniu statystycznym. Model logistyczny jest powszechnie nauczany iz mojego doświadczenia wynika, że wielu badaczy zwróci się do znanego narzędzia zamiast lepszego.
Drugi to właściwie pytanie, co rozumiesz przez badanie „kohortowe”. Coś takiego jak model Coxa lub model Poissona wymaga rzeczywistego oszacowania czasu osobowego. Możliwe jest uzyskanie badania kohortowego, które śledzi nieco zamkniętą populację przez określony czas - szczególnie we wczesnych przykładach „Wprowadzenie do Epi”, w których metody przetrwania, takie jak modele Poissona lub Coxa, nie są tak przydatne. Model logistyczny możebyć stosowane do oszacowania ilorazu szans, który przy wystarczająco niskiej częstości występowania choroby zbliża się do względnego ryzyka. Inne techniki regresji, które bezpośrednio ją szacują, takie jak regresja dwumianowa, mają problemy z konwergencją, które mogą łatwo wykoleić nowego ucznia. Pamiętaj, że cytowane przez ciebie dokumenty Zou wykorzystują technikę regresji Poissona, aby obejść problemy dotyczące zbieżności regresji dwumianowej. Ale dwuwymiarowe badania kohortowe są w rzeczywistości niewielkim wycinkiem „badania kohortowego”.
Tak. Szczerze mówiąc, metody analizy przeżycia powinny pojawić się wcześniej niż często. Moja teoria zwierząt domowych jest taka, że nie jest tak dlatego, że metody takie jak regresja logistyczna są łatwiejsze do kodowania . Techniki, które są łatwiejsze do kodowania, ale mają znacznie większe zastrzeżenia co do ważności ich oszacowań efektów, są nauczane jako „podstawowy” standard, co stanowi problem.
Powinieneś zachęcać uczniów i współpracowników do korzystania z odpowiedniego narzędzia. Ogólnie rzecz biorąc, wydaje mi się, że lepiej byłoby zaproponować rozważenie modelu Coxa w stosunku do regresji Poissona, ponieważ większość recenzentów (i powinna) szybko poruszyłaby obawy dotyczące założenia stałego zagrożenia. Ale tak, im szybciej uda Ci się ich oderwać od „Jak przekształcić moje pytanie w model regresji logistycznej?” tym lepiej wszyscy będziemy. Ale tak, jeśli patrzysz na badanie bez czasu, uczniowie powinni zapoznać się zarówno z regresją dwumianową, jak i metodami alternatywnymi, takimi jak regresja Poissona, które można zastosować w przypadku problemów z konwergencją.
źródło
Ja również spekuluję na temat rozpowszechnienia modeli logistycznych w literaturze, kiedy bardziej odpowiedni byłby model ryzyka względnego. Jako statystycy jesteśmy zbyt dobrze zaznajomieni z przestrzeganiem konwencji lub trzymaniem się analiz „rozwijanego menu”. Stwarzają one znacznie więcej problemów niż rozwiązują. Regresję logistyczną uczy się jako „standardowego narzędzia półki” do analizy wyników binarnych, w których dana osoba ma wynik typu tak / nie, taki jak śmierć lub niepełnosprawność.
Regresję Poissona często uczy się jako metody analizy zliczeń . Podkreśla się nieco, że taki model prawdopodobieństwa działa wyjątkowo dobrze w modelowaniu wyników 0/1, szczególnie gdy są rzadkie. Jednak model logistyczny jest również dobrze stosowany z rzadkimi wynikami: iloraz szans jest w przybliżeniu współczynnikiem ryzyka, nawet przy próbkowaniu zależnym od wyników, jak w przypadku badań kontrolnych. Tego samego nie można powiedzieć o ryzyku względnym ani modelach Poissona.
Model Poissona jest także przydatny, gdy poszczególne osoby mogą mieć „wynik” więcej niż jeden raz, a Ty możesz być zainteresowany skumulowaną częstością, taką jak wybuchy opryszczki, hospitalizacje lub nowotwory piersi. Z tego powodu współczynniki wykładnicze można interpretować jako współczynniki względne . Aby przedstawić różnicę między wskaźnikami a ryzykiem: Jeśli występuje 100 przypadków na 1000 osobolat, ale wszystkie 100 przypadków zdarzyło się u jednej osoby, zapadalność (wskaźnik) wynosi nadal 1 przypadek na 10 osobolat. W placówkach opieki zdrowotnej nadal musisz leczyć 100 przypadków, a zaszczepienie 80% ludzi ma 80% redukcję zachorowań (a priori). Jednak ryzyko co najmniej jednego wyniku wynosi 1/1000. Charakter wyniku i pytanie łącznie decydują o tym, który model jest odpowiedni.
Nawiasem mówiąc, artykuł Zhanga zawiera tendencyjne oszacowanie wnioskowania na podstawie oszacowania ryzyka względnego, które nie uwzględnia zmienności w okresie przechwytywania. Możesz poprawić estymator poprzez ładowanie.
Aby odpowiedzieć na konkretne pytania:
2.3 Myślę, że obwiniasz i zakładasz zbyt wiele o to, co dzieje się w przeglądzie medycznym i naukowcach.
http://biostats.bepress.com/cgi/viewcontent.cgi?article=1128&context=uwbiostat
źródło