Jeśli w tabeli kontyngencji znajdują się zera i dopasowujemy zagnieżdżone modele poissona / loglinearne (używając glm
funkcji R ) do testu współczynnika prawdopodobieństwa, czy musimy dopasować dane przed dopasowaniem modeli glm (np. Dodać 1/2 do wszystkich liczy się)? Oczywiście niektórych parametrów nie można oszacować bez pewnej korekty, ale w jaki sposób korekta / brak korekty wpływają na test LR?
9
glm
rutyna zadziałaby, gdyby nie mogła zera zer. próbowałeś tego?Odpowiedzi:
Jedną z zalet modelowania regresji jest ogólnie to, że można wygładzać obszary bez danych - chociaż, jak zauważyłeś, czasami występują problemy z oszacowaniem parametrów. Sugerowałbym, że jeśli otrzymujesz nieskończone błędy standardowe, nadszedł czas, aby ponownie przemyśleć swoje podejście do modelowania.
Jedna szczególna uwaga: istnieje różnica między „Brakiem liczenia” w poszczególnych warstwach, a niemożliwym jest, aby były one liczone w tych warstwach. Na przykład wyobraź sobie, że pracujesz nad badaniem zaburzeń psychicznych dla amerykańskiej marynarki wojennej w latach 2000-2009 i masz warunki regresji binarnej zarówno dla „Is a Woman”, jak i „Serves on a Submarine”. Model regresji może być w stanie oszacować efekty, w których obie zmienne = 1, mimo że mają zerową liczbę, gdzie oba = 1. Jednak takie wnioskowanie nie byłoby poprawne - taka okoliczność jest niemożliwa. Problem ten nazywa się „brakiem pozytywności” i czasami stanowi problem w wysoce rozwarstwionych modelach.
źródło