Testy Wald, iloraz wiarygodności i mnożnik Lagrange'a w kontekście szacowania maksymalnego prawdopodobieństwa są asymptotycznie równoważne. Jednak w przypadku małych próbek mają one tendencję do rozbieżności, a w niektórych przypadkach prowadzą do różnych wniosków.
Jak można je uszeregować według prawdopodobieństwa odrzucenia wartości zerowej? Co zrobić, gdy testy mają sprzeczne odpowiedzi? Czy możesz po prostu wybrać tę, która daje pożądaną odpowiedź, czy też istnieje „reguła” lub „wytyczna” co do sposobu postępowania?
Odpowiedzi:
Nie znam literatury w tej dziedzinie na tyle dobrze, aby dać bezpośrednią odpowiedź. Wydaje mi się jednak, że jeśli trzy testy różnią się, oznacza to, że potrzebujesz dalszych badań / gromadzenia danych, aby ostatecznie odpowiedzieć na twoje pytanie.
Możesz także spojrzeć na to wyszukiwanie w Google Scholar
Zaktualizuj w odpowiedzi na Twój komentarz:
Jeśli gromadzenie dodatkowych danych nie jest możliwe, istnieje jedno obejście. Wykonaj symulację, która odzwierciedla strukturę danych, wielkość próbki i proponowany model. Możesz ustawić parametry na niektóre z góry określone wartości. Oszacuj model na podstawie wygenerowanych danych, a następnie sprawdź, który z trzech testów wskazuje właściwy model. Taka symulacja zapewniłaby pewne wskazówki dotyczące tego, który test zastosować do rzeczywistych danych. Czy to ma sens?
źródło
Nie udzielę ostatecznej odpowiedzi w kwestii uszeregowania trzech. Zbuduj 95% elementów CI wokół swoich parametrów na podstawie każdego z nich, a jeśli są one radykalnie różne, Twoim pierwszym krokiem powinno być głębsze kopanie. Przekształć swoje dane (choć LR będzie niezmienny), ureguluj swoje prawdopodobieństwo itp. W skrócie, prawdopodobnie wybrałbym test LR i związany z nim CI. Następuje szorstki argument.
LR jest niezmienny przy wyborze parametryzacji (np. T versus logit (T)). Statystyka Walda zakłada normalność (T - T0) / SE (T). Jeśli to się nie powiedzie, twój CI jest zły. Zaletą LR jest to, że nie trzeba znaleźć transformacji f (T), aby spełnić normalność. 95% CI oparte na T będzie takie samo. Ponadto, jeśli twoje prawdopodobieństwo nie jest kwadratowe, Wald 95% CI, który jest symetryczny, może być kapryśny, ponieważ może preferować wartości o niższym prawdopodobieństwie niż te o wyższym prawdopodobieństwie.
Innym sposobem myślenia o LR jest to, że wykorzystuje on więcej informacji, luźno mówiąc, z funkcji prawdopodobieństwa. Wald opiera się na MLE i krzywizny prawdopodobieństwa na wartości zerowej. Wynik opiera się na nachyleniu przy zerowym i krzywiznie przy zerowym. LR ocenia prawdopodobieństwo poniżej wartości zerowej i prawdopodobieństwo po połączeniu wartości zerowej i alternatywnej i łączy te dwie wartości. Jeśli jesteś zmuszony wybrać jedną, może to być intuicyjnie satysfakcjonujące przy wyborze LR.
Należy pamiętać, że istnieją inne powody, takie jak wygoda lub obliczenia, aby wybrać Wald lub Score. Wald jest najprostszy, a biorąc pod uwagę parametr wielowymiarowy, jeśli testujesz ustawienie wielu indywidualnych na 0, istnieją wygodne sposoby przybliżenia prawdopodobieństwa. Lub jeśli chcesz dodać zmienną na raz z jakiegoś zestawu, możesz nie chcieć zmaksymalizować prawdopodobieństwa dla każdego nowego modelu, a implementacja testów wyników oferuje tutaj pewną wygodę. Wald i Score stają się atrakcyjne, gdy twoje modele i prawdopodobieństwo stają się nieatrakcyjne. (Ale nie sądzę, że o to pytałeś, ponieważ masz wszystkie trzy dostępne ...)
źródło