Podczas testowania niektórych hipotez zerowych w porównaniu z alternatywnymi hipotezami za pomocą statystyki testowej , gdzie , zastosuj test permutacji z zestawem permutacji na a my mamy nową statystykę
Jakie są zalety korzystania z testu permutacji w porównaniu z jego niestosowaniem? Tj. Jak to jest, gdy działa test permutacji?
Jakie warunki, aby tak się stało? Takich jak niektóre warunki statystyki testowej i / lub hipotezy zerowej?
Na przykład,
Czy być równy wartości p opartej na dla próbki ? Jeśli tak, dlaczego? (referencje są również mile widziane)
Wartość p dla jest zdefiniowana jako . Jeżeli test permutacji ma oszacować rozkład permutacji U (X) | X = x , w jaki sposób T (X) równa się wartości p U (X) przy X = x ? W szczególności może występować więcej niż jedna dystrybucja w zerowym H , a T (X) nie bierze pod uwagę rozkładów zerowych jeden po drugim, a następnie przyjmuje \ sup_ {F \ in H} i \ inf_ {c: U (x) \ geq c} .
Czy test permutacji powinien sprawić, że wolny od dystrybucji w hipotezach zerowych? Jakie warunki to spowodują?
Czy być równomiernie rozłożony na ? Jakie warunki to spowodują? Zauważ, że gdy jest funkcją stałą, jest również stały przy a rozkład jest daleki od jednorodności w stosunku do .
Dziękuję i pozdrawiam!
Odpowiedzi:
Ponieważ dyskusja wydłużała się, udzieliłem odpowiedzi na odpowiedź. Ale zmieniłem kolejność.
Testy permutacyjne są „dokładne”, a nie asymptotyczne (porównaj na przykład z testami współczynnika wiarygodności). Na przykład można wykonać test środków, nawet bez możliwości obliczenia rozkładu różnicy średnich poniżej wartości zerowej; nie musisz nawet określać zaangażowanych dystrybucji. Możesz zaprojektować statystykę testową, która ma dobrą moc na podstawie zestawu założeń, nie będąc tak wrażliwym na nie, jak w pełni parametryczne założenie (możesz użyć statystyki, która jest solidna, ale ma dobrą ARE).
Zauważ, że podane przez ciebie definicje (a raczej to, kto je tam podaje) nie są uniwersalne; niektórzy nazywają U statystyką testu permutacji (tym, co sprawia, że test permutacji nie jest statystyka, ale sposób oceny wartości p). Ale gdy wykonasz test permutacji i wyznaczysz kierunek, ponieważ „skrajności tego są niespójne z H0”, tego rodzaju definicja dla T powyżej jest w zasadzie sposobem obliczania wartości p - jest to tylko rzeczywista proporcja rozkład permutacji co najmniej tak ekstremalny jak próbka pod wartością zerową (sama definicja wartości p).
Na przykład, jeśli chcę wykonać test (jednostronny, dla uproszczenia) środków takich jak test t dla dwóch próbek, mógłbym uczynić moją statystykę licznikiem statystyki t lub samej statystyki t, lub suma pierwszej próbki (każda z tych definicji jest monotoniczna w pozostałych, uwarunkowana połączoną próbką) lub dowolna ich monotoniczna transformacja i mają ten sam test, ponieważ dają identyczne wartości p. Wszystko, co muszę zrobić, to zobaczyć, jak daleko (pod względem proporcji) rozkład permutacji dowolnej statystyki, którą wybiorę, stanowi statystyka próbna. T, jak zdefiniowano powyżej, to po prostu kolejna statystyka, tak dobra jak każda inna, którą mogłem wybrać (T jak zdefiniowano, że jest monotoniczny w U).
T nie będzie dokładnie jednorodny, ponieważ wymagałoby to ciągłych rozkładów, a T jest z konieczności dyskretny. Ponieważ U i T mogą odwzorować więcej niż jedną permutację w danej statystyce, wyniki nie są równoważne, ale mają „jednolity” cdf **, ale taki, w którym kroki niekoniecznie są równej wielkości .
** ( , i dokładnie równa temu przy odpowiednim limicie każdego skoku - prawdopodobnie istnieje nazwa tego, co tak naprawdę jest)F(x)≤x
Dla rozsądnych statystyk, gdy idzie w nieskończoność, rozkład zbliża się do jednorodności. Myślę, że najlepszym sposobem na ich zrozumienie jest zrobienie ich w różnych sytuacjach.n T
T jest wartością p (w przypadkach, gdy duże U wskazuje odchylenie od wartości zerowej, a małe U jest z nim zgodne). Zauważ, że rozkład zależy od próbki. Więc jego dystrybucja nie jest „dla żadnej próbki”.
Wyjaśniłem już, że T nie jest jednolity.
Myślę, że już wyjaśniłem, co widzę jako zalety testów permutacyjnych; inni zasugerują inne zalety ( np .).
Cytowane zdanie wyraźnie stwierdza, że T jest wartością p, i kiedy jest. Jeśli potrafisz wyjaśnić, co jest niejasne, może mógłbym powiedzieć więcej. Jeśli tak, to dlaczego zobacz definicję wartości p (pierwsze zdanie pod linkiem) - z tego wynika wprost
Jest to dobry podstawowy dyskusja testów permutacji tutaj .
-
Edycja: Dodaję tutaj mały przykład testu permutacji; ten kod (R) jest odpowiedni tylko dla małych próbek - potrzebujesz lepszych algorytmów do znajdowania ekstremalnych kombinacji w umiarkowanych próbkach.
Rozważ test permutacji w stosunku do jednostronnej alternatywy:
* ale zwykle tego unikam, ponieważ szczególnie mylą ten problem dla studentów, gdy próbują wypracować zerowe rozkłady
na następujących danych:
Istnieje 35 sposobów na podzielenie 7 obserwacji na próbki wielkości 3 i 4:
Jak wspomniano wcześniej, biorąc pod uwagę 7 wartości danych, suma pierwszej próbki jest monotoniczna w różnicy średnich, więc zastosujmy to jako statystykę testową. Oryginalna próbka ma więc statystykę testową:
Oto rozkład permutacji:
(Nie jest konieczne ich sortowanie, właśnie to zrobiłem, aby ułatwić sprawdzenie, czy statystyki testowe są drugą wartością od końca.)
Widzimy (w tym przypadku przez kontrolę), że wynosi 2/35, lubp
(Należy zauważyć, że tylko w przypadku braku nakładania się xy możliwa jest tutaj wartość p poniżej 0,05. W tym przypadku byłby dyskretnie jednorodny, ponieważ w nie ma żadnych powiązanych wartości ).T U
Różowe strzałki wskazują statystykę próbki na osi x, a wartość p na osi y.
źródło