Czy poprawnie oblicziłem te współczynniki prawdopodobieństwa?

18

Jestem autorem pakietu ez dla R i pracuję nad aktualizacją w celu włączenia automatycznego obliczania ilorazów wiarygodności (LR) w danych wyjściowych ANOVA. Chodzi o to, aby zapewnić LR dla każdego efektu, który jest analogiczny do testu tego efektu, który osiąga ANOVA. Na przykład LR dla efektu głównego reprezentuje porównanie modelu zerowego z modelem, który zawiera efekt główny, LR dla interakcji reprezentuje porównanie modelu, który obejmuje oba składowe efekty główne w porównaniu z modelem, który obejmuje zarówno efekty główne, jak i ich interakcja itp.

Teraz rozumiem obliczenia LR na podstawie Glovera i Dixona ( PDF ), który obejmuje podstawowe obliczenia, a także poprawki na złożoność, oraz dodatku do Bortolussi & Dixon ( załącznik PDF ), który obejmuje obliczenia obejmujące zmienne wielokrotnego pomiaru. Aby przetestować moje zrozumienie, opracowałem ten arkusz kalkulacyjny , który bierze dfs i SS z przykładowej ANOVA (wygenerowanej z projektu 2 * 2 * 3 * 4 przy użyciu fałszywych danych) i krok po kroku obliczania LR dla każdego efektu.

Byłbym bardzo wdzięczny, gdyby ktoś z większą pewnością siebie przy takim obliczeniu mógł rzucić okiem i upewnić się, że wszystko zrobiłem poprawnie. Dla tych, którzy wolą kod abstrakcyjny, oto kod R implementujący aktualizację do ezANOVA () (patrz zwłaszcza linie 15-95).

Mike Lawrence
źródło

Odpowiedzi:

3

Chociaż rozumowanie dotyczące obliczania LR na podstawie wartości SS jest dość uczciwe, metoda najmniejszych kwadratów jest równoważna, ale nie taka sama jak oszacowanie prawdopodobieństwa. (Różnicę można zilustrować np. W obliczeniu se, które jest podzielone przez (n-1) w metodzie najmniejszych kwadratów i podzielone przez n dla największego prawdopodobieństwa. Szacunek maksymalnego prawdopodobieństwa jest zatem spójny, ale nieco tendencyjny ).

Ma to pewne implikacje: możesz obliczyć LR, ponieważ prawdopodobieństwo jest proporcjonalne do , ale to nie daje prawdopodobieństwa samego modelu anova. Po prostu mówi ci coś o stosunku. Ponieważ AIC jest klasycznie definiowany pod względem prawdopodobieństwa, nie jestem pewien, czy możesz użyć AIC zgodnie z zamierzeniami.1s

Spojrzałem na arkusz kalkulacyjny, ale wartości dla „nieskorygowanego LR wewnątrz” (nie do końca śledzę dokładnie to, co próbujesz tam obliczyć) wydają mi się bardzo mało prawdopodobne.

Na marginesie, moc testowania LR polega na tym, że możesz po prostu kontrastować modele, które chcesz, nie musisz tego robić dla wszystkich (co obniża błąd multitestowania). Jeśli zrobisz to dla każdego terminu, twój LR jest całkowicie równoważny testowi F, aw przypadku najmniejszych kwadratów, o ile wiem nawet liczbowo o tym samym.

Twoja mila może się różnić, ale nigdy nie byłem pewien mieszania koncepcji dwóch różnych ram (tj. Najmniejszych kwadratów w porównaniu do maksymalnego prawdopodobieństwa). Osobiście zgłosiłbym statystyki F i zaimplementował LR w funkcji, która pozwala porównywać modele (np. Funkcja anova dla modeli lme, która robi dokładnie to).

Moje 2 centy.

PS: Patrzyłem na twój kod, ale tak naprawdę nie mogłem rozgryźć wszystkich zmiennych. Jeśli dodasz adnotacje do swojego kodu za pomocą komentarzy, to ułatwiłoby ci życie. Arkusz EXCEL również nie jest najłatwiejszy do zrozumienia. Sprawdzę później, czy mogę coś z tego zrobić.

Joris Meys
źródło