Ogólny model liniowy a uogólniony model liniowy (z funkcją powiązania tożsamości?)

25

To jest mój pierwszy post, więc uspokój się, jeśli nie przestrzegam niektórych standardów! Poszukałem pytania i nic nie wyszło.

Moje pytanie dotyczy głównie praktycznych różnic między ogólnym modelowaniem liniowym (GLM) a uogólnionym modelowaniem liniowym (GZLM). W moim przypadku byłoby to kilka zmiennych ciągłych jako współzmiennych i kilka czynników w ANCOVA w porównaniu do GZLM. Chcę zbadać główne efekty każdej zmiennej, a także jedną trójstronną interakcję, którą przedstawię w modelu. Widzę tę hipotezę testowaną w ANCOVA lub przy użyciu GZLM. W pewnym stopniu rozumiem procesy matematyczne i rozumowanie stojące za uruchomieniem ogólnego modelu liniowego, takiego jak ANCOVA, i nieco rozumiem, że GZLM pozwalają na połączenie funkcji łączącej model liniowy i zmienną zależną (okłamałem, może nie naprawdę rozumiem matematykę). Czego naprawdę nie wiem? Rozumiem, jakie są praktyczne różnice lub powody przeprowadzenia jednej analizy, a nie drugiej, gdy rozkład prawdopodobieństwa zastosowany w GZLM jest normalny (tj. funkcja powiązania tożsamości?). Otrzymuję bardzo różne wyniki, gdy biegam jeden po drugim. Czy mogę uruchomić? Moje dane są nieco nienormalne, ale do pewnego stopnia działają zarówno w ANCOVA, jak i GZLM. W obu przypadkach moja hipoteza jest obsługiwana, ale w GZLM wartość p jest „lepsza”.

Myślałem, że ANCOVA jest modelem liniowym z normalnie dystrybuowaną zmienną zależną przy użyciu funkcji powiązania tożsamości, która jest dokładnie tym, co mogę wprowadzić w GZLM, ale nadal są one różne.

Proszę rzucić nieco światła na te pytania, jeśli możesz!


Na podstawie pierwszej odpowiedzi mam dodatkowe pytanie:

Jeśli są identyczne, z wyjątkiem zastosowanego testu istotności (tj. Testu F w porównaniu z kwadratem Wald Chi Chi), który z nich byłby najbardziej odpowiedni? ANCOVA to „metoda przejścia”, ale nie jestem pewien, dlaczego test F byłby lepszy. Czy ktoś może rzucić nieco światła na to pytanie? Dzięki!

Behacad
źródło
tfa
gung - Przywróć Monikę

Odpowiedzi:

23

Uogólniony model liniowy określający funkcję powiązania tożsamości i rozkład normalnej rodziny jest dokładnie równoważny (ogólnemu) modelowi liniowemu. Jeśli otrzymujesz zauważalnie różne wyniki od każdego z nich, robisz coś złego.

Pamiętaj, że określenie łącza tożsamości nie jest tym samym, co określenie rozkładu normalnego. Rozkład i funkcja łącza są dwoma różnymi komponentami uogólnionego modelu liniowego i każdy może być wybrany niezależnie od siebie (chociaż niektóre łącza działają lepiej z pewnymi rozkładami, więc większość pakietów oprogramowania określa wybór łączy dozwolonych dla każdej dystrybucji).

pptfatfa oprogramowanie do uogólnionych modeli liniowych może również wykorzystywać je jako przybliżenia przy dopasowywaniu innych rodzin za pomocą parametru skali szacowanego na podstawie danych.

jeden przystanek
źródło
Dziękuję za odpowiedź! Cieszę się, że usłyszałem twoją odpowiedź, ponieważ takie było moje pierwotne założenie. Profesor w mojej instytucji powiedział mi inaczej, więc naprawdę musiałem kopać. Używam SPSS i teraz widzę, że oszacowania parametrów są rzeczywiście identyczne (np. Wartości B). Widzę teraz, że to, co pierwotnie mnie pomieszało, to różne wartości p. Statystyka ANCOVA opiera się na standardowym teście F, podczas gdy GZLM opiera się na Wald-Chi-Square, prawda? Czytałem, że Wald Chi-Square jest używany, gdy używasz parametrów próbki (takich jak w GZLM).
Behacad,
Na podstawie tej odpowiedzi dodałem pytanie do oryginalnego postu!
Behacad
Ok, w odpowiedzi dodałem odpowiedni paragraf do mojej odpowiedzi.
onestop
5

Chciałbym uwzględnić moje doświadczenie w tej dyskusji. Widziałem, że uogólniony model liniowy (określający funkcję powiązania tożsamości i normalny rozkład rodziny) jest identyczny z ogólnym modelem liniowym tylko wtedy, gdy używasz oszacowania maksymalnego prawdopodobieństwa jako metody parametru skali. W przeciwnym razie, jeśli jako metodę parametru skali wybrano „wartość stała = 1”, otrzymamy bardzo różne wartości p. Z mojego doświadczenia wynika, że ​​zwykle należy unikać „stałej wartości = 1”. Jestem ciekawy, czy ktoś wie, kiedy należy wybrać stałą wartość = 1 jako metodę parametru skali. Z góry dziękuję. znak


źródło
3
Zazwyczaj stosuje się stałą skalę tylko w modelach takich jak regresja logistyczna lub regresja Poissona, gdzie reakcja jest zmienną zliczania lub wskaźnika / częstotliwości. W tym przypadku nie ma analogii do parametru skali w regresji normalnej.
Hong Ooi,