Czy liczby zerowe muszą zostać dostosowane do testu współczynnika wiarygodności modeli Poissona / Loglinear?

9

Jeśli w tabeli kontyngencji znajdują się zera i dopasowujemy zagnieżdżone modele poissona / loglinearne (używając glmfunkcji R ) do testu współczynnika prawdopodobieństwa, czy musimy dopasować dane przed dopasowaniem modeli glm (np. Dodać 1/2 do wszystkich liczy się)? Oczywiście niektórych parametrów nie można oszacować bez pewnej korekty, ale w jaki sposób korekta / brak korekty wpływają na test LR?

BR1
źródło
przypuszczalnie glmrutyna zadziałaby, gdyby nie mogła zera zer. próbowałeś tego?
shabbychef
1
tak, nie ulega awarii, ale w zależności od wzoru (np. w modelu nasyconym) niektóre parametry mogą mieć nieskończenie wiele standardowych błędów. Moje pytanie brzmi, czy jest to problem podczas wykonywania testu współczynnika wiarygodności. Nadal możesz obliczyć prawdopodobieństwo, nawet jeśli niektóre parametry nie są oszacowane, parametry te po prostu nie przyczynią się do prawdopodobieństwa. Jaka jest standardowa praktyka i dlaczego?
BR1

Odpowiedzi:

7

Jedną z zalet modelowania regresji jest ogólnie to, że można wygładzać obszary bez danych - chociaż, jak zauważyłeś, czasami występują problemy z oszacowaniem parametrów. Sugerowałbym, że jeśli otrzymujesz nieskończone błędy standardowe, nadszedł czas, aby ponownie przemyśleć swoje podejście do modelowania.

Jedna szczególna uwaga: istnieje różnica między „Brakiem liczenia” w poszczególnych warstwach, a niemożliwym jest, aby były one liczone w tych warstwach. Na przykład wyobraź sobie, że pracujesz nad badaniem zaburzeń psychicznych dla amerykańskiej marynarki wojennej w latach 2000-2009 i masz warunki regresji binarnej zarówno dla „Is a Woman”, jak i „Serves on a Submarine”. Model regresji może być w stanie oszacować efekty, w których obie zmienne = 1, mimo że mają zerową liczbę, gdzie oba = 1. Jednak takie wnioskowanie nie byłoby poprawne - taka okoliczność jest niemożliwa. Problem ten nazywa się „brakiem pozytywności” i czasami stanowi problem w wysoce rozwarstwionych modelach.

Fomite
źródło
@ skyguy94 Dziwne, że nie wiem - wiedziałem, że właśnie zapomniałem zauważyć użycie retrospektywnego zestawu danych>. <. Edytowane, aby to odzwierciedlić.
Fomite,
Re: „Model regresji może być w stanie oszacować efekty, w których obie zmienne = 1, lub interakcje między nimi ” - nie sądzę, że to prawda. Jeśli masz dwa binarne predyktory, które nigdy nie są razem „1”, to interakcja jest stała (zawsze jest to „0”), więc jej efekt nie jest identyfikowany.
Makro
@Macro Masz rację, nieznacznie edytuję. Myślałem o terminach, w których nie są to wskaźniki binarne.
Fomite
1
(+1) Tak więc, problemy z niewiarygodnością przypadku, w którym oba = 1 na bok, oszacowanie oparte na modelu byłoby po prostu sumą dwóch marginalnych efektów, które, jak wiemy, mogą same w sobie być bardzo mylące :)
Makro