Statystyka testowa Durbin, Watson może leżeć w obszarze jednoznaczne, w których nie jest możliwe albo odrzucić czy nie odrzucenia hipotezy zerowej (w tym przypadku zero autokorelacji).
Jakie inne testy statystyczne mogą dać „niejednoznaczne” wyniki?
Czy istnieje ogólne wyjaśnienie (machanie ręką jest w porządku), dlaczego ten zestaw testów nie jest w stanie podjąć binarnej decyzji o „odrzuceniu” / „odmowie odrzucenia”?
Byłoby bonusem, gdyby ktoś mógł wspomnieć o implikacjach teoretycznych jako części odpowiedzi na drugie pytanie - czy obecność dodatkowej kategorii (nie) wniosków oznacza, że musimy wziąć pod uwagę koszty typu I i typu II błędy w bardziej wyrafinowany sposób?
Odpowiedzi:
Artykuł w Wikipedii wyjaśnia, że rozkład statystyki testowej pod hipotezą zerową zależy od macierzy projektowej - szczególnej konfiguracji wartości predykcyjnych używanych w regresji. Durbin i Watson obliczyli dolne granice dla statystyki testowej, zgodnie z którymi test dodatniej autokorelacji musi odrzucić, przy danych poziomach istotności, dla dowolnej matrycy projektowej, i górne granice, powyżej których test musi nie zostać odrzucony dla dowolnej matrycy projektowej. „Niejednoznaczny region” to tylko region, w którym należy obliczyć dokładne wartości krytyczne, biorąc pod uwagę macierz projektową, aby uzyskać jednoznaczną odpowiedź.
Analogiczną sytuacją byłoby wykonanie testu t dla pojedynczej próby, jeśli znasz tylko statystykę t, a nie wielkość próby † : 1,645 i 6,31 (odpowiadające nieskończonym stopniom swobody i tylko jednej) granice dla testu wielkości 0,05.
Jeśli chodzi o teorię decyzji - masz nowe źródło niepewności, które należy wziąć pod uwagę oprócz wariantu próbkowania, ale nie rozumiem, dlaczego nie powinno się go stosować w taki sam sposób, jak w przypadku złożonych hipotez zerowych. Jesteś w takiej samej sytuacji jak ktoś z nieznanym parametrem uciążliwości, niezależnie od tego, jak się tam dostałeś; więc jeśli musisz podjąć decyzję o odrzuceniu / zachowaniu przy jednoczesnym kontrolowaniu błędu Typu I nad wszystkimi możliwościami, odrzuć zachowawczo (tj. gdy statystyki Durbina-Watsona są poniżej dolnej granicy lub statystyki t powyżej 6,31).
† A może straciłeś swoje stoliki; ale pamięta niektóre wartości krytyczne dla standardowego Gaussa i wzór na funkcję kwantyli Cauchy'ego.
źródło
Innym przykładem testu z potencjalnie niejednoznacznymi wynikami jest test dwumianowy dla proporcji, gdy dostępna jest tylko proporcja, a nie wielkość próbki. Nie jest to całkowicie nierealne - często widzimy lub słyszymy słabo zgłoszone twierdzenia o formie „73% ludzi zgadza się, że ...” i tak dalej, gdy mianownik nie jest dostępny.
Kod R.
(Kod zaokrąglania jest wycinany z tego pytania StackOverflow .)
źródło