Testy permutacyjne to testy istotności oparte na próbkach permutacyjnych losowo pobranych z oryginalnych danych. Próbki permutacji są rysowane bez zamiany, w przeciwieństwie do próbek bootstrap, które są rysowane z zamianą. Oto przykład, który zrobiłem w R prostego testu permutacji. (Twoje komentarze są mile widziane)
Testy permutacyjne mają ogromne zalety. Nie wymagają określonych kształtów populacji, takich jak normalność. Odnoszą się one do różnych statystyk, nie tylko do statystyk, które mają prosty rozkład pod hipotezą zerową. Mogą dawać bardzo dokładne wartości p, niezależnie od kształtu i wielkości populacji (jeśli zastosuje się wystarczającą liczbę permutacji).
Przeczytałem również, że często przydatne jest podanie przedziału ufności wraz z testem, który jest tworzony przy użyciu ponownego próbkowania bootstrap zamiast ponownego próbkowania permutacyjnego.
Czy możesz wyjaśnić (lub po prostu podać kod R), jak konstruowany jest przedział ufności (tj. Dla różnicy między średnimi dwóch próbek w powyższym przykładzie)?
EDYTOWAĆ
Po pewnym googlowaniu znalazłem tę ciekawą lekturę .
źródło
sample
ireplace=TRUE
? Czy jest jakiś powód, aby użyć takiego pakietuboot
?sum(b$t>=b$t0)/b$R
Ponieważ test permutacji jest testem dokładnym , dającym dokładną wartość p. Uruchomienie testu permutacji nie ma sensu.
Poza tym określenie przedziału ufności wokół statystyki testowej również nie ma sensu, ponieważ jest obliczane na podstawie próbki, a nie oszacowania. Przedziały ufności ustalane są wokół szacunków takich jak średnie i podobne, ale nie wokół statystyk testowych.
Testów permutacyjnych nie należy używać w zestawach danych, które są tak duże, że nie można już obliczyć wszystkich możliwych permutacji. W takim przypadku użyj procedury ładowania początkowego, aby ustalić wartość graniczną dla używanej statystyki testowej. Ale znowu nie ma to nic wspólnego z 95% przedziałem ufności.
Przykład: używam tutaj klasycznej statystyki T, ale używam prostego podejścia do ładowania początkowego w celu obliczenia rozkładu empirycznego mojej statystyki. Na tej podstawie obliczam empiryczną wartość p:
Weź pod uwagę, że to dwustronne testowanie działa tylko w przypadku rozkładów symetrycznych. Rozkłady niesymetryczne są zwykle testowane tylko jednostronnie.
EDYTOWAĆ :
OK, źle zrozumiałem pytanie. Jeśli chcesz obliczyć przedział ufności dla oszacowania różnicy, możesz użyć kodu wymienionego tutaj do ładowania początkowego w każdej próbce. Pamiętaj, że jest to tendencyjne oszacowanie: generalnie daje to zbyt niski CI. Zobacz także podany tam przykład jako powód, dla którego musisz zastosować inne podejście do przedziału ufności i wartości p.
źródło
x[6:11]
odnosi się do argumentux
funkcji anonimowej w aplikacji Apply. Może mylące, ale Twoja edycja dała bardzo złe wyniki. Skomentuj, co Twoim zdaniem powinno być, przed edycją kodu. Oszczędza mi cofnięcia. Aby uniknąć dalszych nieporozumień, zmieniłem tox
nai
Z kodu Jorisa Meysa w odpowiedziach, ale z modyfikacją umożliwiającą zastosowanie go w więcej niż jednej sytuacji:
Próbowałem edytować drugi, ale nie miałem czasu na dokończenie iz jakiegoś powodu nie mogę komentować (może dlatego, że jest to stare pytanie).
źródło