W pracy wykorzystano uogólnione modele liniowe (zarówno dwumianowe, jak i ujemne dwumianowe rozkłady błędów) do analizy danych. Ale w sekcji metod analizy statystycznej znajduje się następujące stwierdzenie:
... i po drugie poprzez modelowanie danych obecności za pomocą modeli regresji logistycznej oraz danych czasu poszukiwania za pomocą uogólnionego modelu liniowego (GLM). Do modelowania danych czasu poszukiwania zastosowano ujemny rozkład dwumianowy z funkcją logarytmiczną (Welsh i in. 1996), a adekwatność modelu zweryfikowano na podstawie badań pozostałości (McCullagh i Nelder 1989). Testy Shapiro – Wilka lub Kołmogorowa – Smirnowa wykorzystano do przetestowania normalności w zależności od wielkości próby; dane poddano transformacji logarytmicznej przed analizami, aby zachować zgodność z normalnością.
Jeśli przyjmą dwumianowy i ujemny dwumianowy rozkład błędów, to na pewno nie powinni sprawdzać normalności reszt?
Odpowiedzi:
jeśli iyi=0
jeśli , gdzie ^ π i jest dopasowanym prawdopodobieństwem Bernoulliego. Ponieważ każda z nich może przyjąć tylko jedną z dwóch wartości, jasne jest, że ich rozkład nie może być normalny, nawet dla poprawnie określonego modelu:yi=1 πi^
Podobnie jest w przypadku Poissona lub ujemnych dwumianowych GLM: dla niskich przewidywanych zliczeń rozkład reszt jest dyskretny i wypaczony, ale ma tendencję do normalności dla większych zliczeń w poprawnie określonym modelu.
Nie jest zwykle, przynajmniej nie w mojej szyi w lesie, przeprowadzanie formalnego testu resztkowej normalności; jeśli testowanie normalności jest zasadniczo bezużyteczne, gdy model zakłada dokładną normalność, a fortiori jest bezużyteczne, gdy nie jest. Niemniej jednak w przypadku nienasyconych modeli graficzna diagnostyka resztkowa jest przydatna do oceny obecności i charakteru braku dopasowania, biorąc normalność ze szczyptą lub garścią soli w zależności od liczby powtórzeń na wzór predykcyjny.
źródło
To, co zrobili, jest poprawne! Dam ci odniesienie do podwójnej kontroli. Patrz sekcja 13.4.4 we wstępie do analizy regresji liniowej, wydanie 5autorzy: Douglas C. Montgomery, Elizabeth A. Peck, G. Geoffrey Vining. W szczególności spójrz na przykłady na stronie 460, gdzie pasują one do dwumianowego glm i dwukrotnie sprawdź założenie normalności „Pozostałości dewiacji”. Jak wspomniano na stronie 458, dzieje się tak, ponieważ „reszty dewiacyjne zachowują się podobnie jak zwykłe reszty w standardowym modelu regresji liniowej z normalną teorią”. Ma to więc sens, jeśli wykreślasz je na normalnej skali prawdopodobieństwa, a także w stosunku do dopasowanych wartości. Ponownie patrz strona 456 powyższego odnośnika. W przykładach, które podali na stronach 460 i 461, nie tylko dla przypadku dwumianowego, ale także dla Poissona glm i Gamma z (link = log), sprawdzili normalność reszt dewiacyjnych.
Dla przypadku dwumianowego odchylenie resztkowe jest zdefiniowane jako:
Sprawdź tutaj również przypadek Poissona.
źródło