Odpowiadając na to pytanie, John Christie zasugerował, że dopasowanie modeli regresji logistycznej należy oceniać poprzez ocenę reszt. Znam sposób interpretowania reszt w OLS, są one w tej samej skali co DV i bardzo wyraźnie różnica między y przewidywana przez model y. Jednak w przypadku regresji logistycznej w przeszłości zwykle badałem szacunki dopasowania modelu, np. AIC, ponieważ nie byłem pewien, co będzie oznaczać wartość rezydualna dla regresji logistycznej. Po spojrzeniu na pomoc R w plikach trochę widzę, że w R istnieje pięć rodzajów reszt GLM dostępnych c("deviance", "pearson", "working","response", "partial")
. Plik pomocy odnosi się do:
- Davison, AC i Snell, EJ (1991) Resztki i diagnostyka. W: Teoria statystyczna i modelowanie. Na cześć Sir Davida Coxa, FRS , red. Hinkley, DV, Reid, N. i Snell, EJ, Chapman & Hall.
Nie mam kopii tego. Czy istnieje krótki sposób na opisanie sposobu interpretacji każdego z tych typów? Czy w kontekście logistycznym suma kwadratów reszt zapewni znaczącą miarę dopasowania modelu, czy może lepiej jest z Kryterium Informacyjnym?
binnedplot
funkcja w ramieniu pakietu R daje bardzo pomocny wykres reszt. Jest ładnie opisany na str. 97-101 Gelman i Hill 2007 .Odpowiedzi:
Przeprowadzanie regresji logistycznej jest podobne do znajdowania wartości beta takiej, że suma kwadratów odchyleń odchylenia jest zminimalizowana.
Można to zilustrować fabułą, ale nie wiem, jak ją załadować.
źródło
plogit
? Nie było jasne, czy definiujesz to tutaj, czy otrzymujesz skądinąd.plogit
jest w R (statystyki), nie wymaga pakietu (przynajmniej nie więcej)Na resztkach Pearsona,
Reszta Pearsona jest różnicą między zaobserwowanymi i oszacowanymi prawdopodobieństwami podzielonymi przez dwumianowe odchylenie standardowe szacowanego prawdopodobieństwa. Dlatego ujednolicenie resztek. W przypadku dużych próbek znormalizowane pozostałości powinny mieć rozkład normalny.
Od Menard, Scott (2002). Zastosowana analiza regresji logistycznej, wydanie drugie. Thousand Oaks, Kalifornia: Sage Publications. Seria: Ilościowe zastosowania w naukach społecznych, nr 106. Wydanie pierwsze, 1995 r. Patrz rozdział 4.4
źródło
Reszty robocze są resztkami w końcowej iteracji dowolnej iteracyjnie ważonej metody najmniejszych kwadratów . Uważam, że oznacza to resztki, gdy myślimy, że jest to ostatnia iteracja naszego uruchomienia modelu. Może to prowadzić do dyskusji, że prowadzenie modelu jest ćwiczeniem iteracyjnym.
źródło