Jak sprawdzić medianę populacji?

9

Mam próbkę 250 jednostek. Rozkład jest asymetryczny. Chcę przetestować hipotezę, że mediana populacji różni się od 3,5, więc myślę, że odpowiedni byłby test z jedną próbą. Wiem, że test rang Wilcoxona nie jest odpowiedni, ponieważ rozkład nie jest symetryczny. Czy można użyć testu znakowego? Jeśli tak nie jest, czy ktoś może polecić inny test?

LeonRupnik
źródło
3
Straciłeś mnie na pierwszej linii z kilku powodów. (1) Próbka nie może mieć rozkładu Gaussa (ale może mieć go w przybliżeniu). (2) Jedną cechą wszystkich rozkładów Gaussa (a zatem ich przybliżeń) jest symetria . Zaprzeczyłeś sobie. Opisując swoje dane na własnych warunkach, a nie żargonie statystycznym, lepiej komunikujesz się z tym, co masz. Czy możesz również wyjaśnić, w możliwie najprostszy sposób, co naprawdę chcesz osiągnąć dzięki swoim danym? Jakie informacje ma na celu „próba oparta na medianie”?
whuber
1
Mediana próbki jest czymkolwiek; nie byłoby potrzeby tego testować. Być może chcesz sprawdzić, czy mediana populacji (z której uzyskano próbkę) jest równa3.5? Jeśli tak, ważne jest, aby wiedzieć, jak wartość3.5został opracowany. Czy to może streszczenie jakiegoś innego zestawu danych? A może jest to z góry określona liczba, na przykład standard jakości?
whuber
1
Jest to z góry określona liczba
LeonRupnik
2
Dystrybucja jest asymetryczna, dlatego chcę przetestować hipotezę, jeśli mediana populacji różni się od 3,5 ...” - Dlaczego asymetria w próbie miałaby wpływ na to, która hipoteza jest interesująca?Czy test znaku jest odpowiedni do użycia? ” - jasne, ale (przynajmniej w oryginalnej formie) polega on na ciągłości - musisz go dostosować, jeśli twoja zmienna jest dyskretna (nie mówisz, z czego składają się twoje dane) .
Glen_b
Dane są ciągłe
LeonRupnik

Odpowiedzi:

8

Streszczenie

Liczba danych przekraczająca 3.5 ma rozkład dwumianowy z nieznanym prawdopodobieństwem p. Użyj tego do przeprowadzenia dwumianowego testup=1/2) przeciw alternatywie p1/2).

Pozostała część tego postu wyjaśnia podstawowy model i pokazuje, jak wykonać obliczenia. Zapewnia działający Rkod do ich wykonania. W mojej odpowiedzi na „Jakie jest znaczenie wartości p i wartości t w testach statystycznych?” Znajduje się rozszerzony opis teorii testowania hipotez ? .

Model statystyczny

Zakładając, że wartości są dość zróżnicowane (z kilkoma powiązaniami na poziomie 3.5), a następnie pod hipotezą zerową każda losowo próbkowana wartość ma wartość 1/2)=50% szansa na przekroczenie 3.5 (od 3.5jest określany jako średnia wartość populacji). Zakładając wszystko250 wartości losowo i niezależnie pobierano próbki, a ich liczba przekraczała 3.5 będzie zatem miał dwumianowy(250,1/2))dystrybucja. Nazwijmy ten numer „liczyć”k.

Z drugiej strony, jeśli mediana populacji różni się 3.5, szansa na przekroczenie losowej wartości próby 3.5 będzie się różnić od 1/2). To jest hipoteza alternatywna.

Znalezienie odpowiedniego testu

Najlepszym sposobem na odróżnienie sytuacji zerowej od jej alternatyw jest przyjrzenie się wartościom kktóre są najprawdopodobniej poniżej zera i mniej prawdopodobne w ramach alternatyw. Są to wartości bliskie1/2) z 250, równy 125. Zatem region krytyczny dla twojego testu składa się z wartości stosunkowo odległych125: blisko 0 lub blisko 250. Ale jak daleko125 muszą stanowić znaczący dowód na to 3.5 nie jest mediana populacji?

W zależności od standardu znaczenia: nazywa się to rozmiarem testowym , często nazywanymα. Zgodnie z hipotezą zerową powinno być blisko - ale nie więcej niż -α szansa, że k będzie w regionie krytycznym.

Zwykle, gdy nie mamy wstępnych założeń, która alternatywa będzie miała zastosowanie - mediana większa lub mniejsza niż 3.5- próbujemy zbudować region krytyczny, aby była połowa tej szansy, α/2), to k jest niski, a druga połowa, α/2), to kjest wysoko. Ponieważ znamy rozkładk zgodnie z hipotezą zerową informacja ta wystarcza do określenia regionu krytycznego.

Technicznie istnieją dwa typowe sposoby przeprowadzania obliczeń: obliczanie prawdopodobieństw dwumianowych lub przybliżanie ich za pomocą rozkładu normalnego.

Obliczanie z prawdopodobieństwami dwumianowymi

Użyj funkcji punktu procentowego (kwantyla). Na Rprzykład jest to wywoływane qbinomi wywoływane jak

alpha <- 0.05 # Test size
c(qbinom(alpha/2, 250, 1/2)-1, qbinom(1-alpha/2, 250, 1/2)+1)

Dane wyjściowe dla α=0,05 jest

109 141

Oznacza to, że region krytyczny obejmuje wszystkie niskie wartości k pomiędzy (i włącznie) 0 i 109, wraz ze wszystkimi wysokimi wartościami k pomiędzy (i włącznie) 141 i 250. Jako czek możemy poprosić Ro obliczenie szansy, która kleży w tym regionie, gdy wartość null jest prawdziwa:

pbinom(109, 250, 1/2) + (1-pbinom(141-1, 250, 1/2))

Dane wyjściowe to 0,0497, bardzo blisko - ale nie więcej niż -αsamo. Ponieważ obszar krytyczny musi kończyć się liczbą całkowitą, zwykle nie jest możliwe, aby ten rzeczywisty rozmiar testu był dokładnie równy nominalnemu rozmiarowi testuα, ale w tym przypadku dwie wartości są rzeczywiście bardzo zbliżone.

Obliczenia z normalnym przybliżeniem

Średnia z dwumianu(250,1/2)) dystrybucja jest 250×1/2)=125 a jego wariantem jest 250×1/2)×(1-1/2))=250/4, dzięki czemu jego odchylenie standardowe jest równe 250/47,9. Zastąpimy rozkład dwumianowy rozkładem normalnym. Standardowy rozkład normalny maα/2)=0,05/2) jego prawdopodobieństwo jest mniejsze niż -1,95996, zgodnie z obliczeniem Rpolecenia

qnorm(alpha/2)

Ponieważ rozkłady normalne są symetryczne, tak też jest 0,05/2) jego prawdopodobieństwo jest większe niż +1,95996. Dlatego region krytyczny składa się z wartościk które są więcej niż 1,95996 standardowe odchylenia od 125. Oblicz te progi: są równe125±7,9×1,96109,5,140,5. Obliczenia można wykonać za jednym zamachem

250*1/2 + sqrt(250*1/2*(1-1/2)) * qnorm(alpha/2) * c(1,-1)

Od k musi być liczbą całkowitą, widzimy, że wpadnie w krytyczny region, kiedy to będzie 109 lub mniej lub 141albo lepszy. Ta odpowiedź jest identyczna z odpowiedzią uzyskaną przy użyciu dokładnego obliczenia dwumianowego. Zazwyczaj ma to miejsce, gdyp jest bliżej 1/2) niż jest to 0 lub 1, wielkość próbki jest umiarkowana do dużej (dziesiątki lub więcej), oraz α nie jest bardzo mały (kilka procent).


Ten test, ponieważ nie zakłada niczego o populacji (z wyjątkiem tego, że nie ma dużego prawdopodobieństwa skoncentrowanego bezpośrednio na swojej medianie), nie jest tak potężny jak inne testy, które przyjmują konkretne założenia dotyczące populacji. Jeśli jednak test odrzuci zero, nie trzeba się martwić brakiem mocy. W przeciwnym razie musisz dokonać delikatnych kompromisów między tym, co jesteś gotów założyć, a tym, co możesz wyciągnąć na temat populacji.

Whuber
źródło
2
Ponieważ jest to praktycznie sprawdzony przykład twojej raczej bardziej abstrakcyjnej odpowiedzi na „ znaczenie wartości p ”, nie tylko w popieraniu tej samej filozofii, ale w strukturze odpowiedzi, myślę, że powinieneś ją powiązać („Przykład jak to jest stosowane w praktyce, można znaleźć w mojej odpowiedzi na ... ”) w podsumowaniu odpowiedzi.
Silverfish,
2
@Silver Dziękuję; to rzeczywiście przyszło mi do głowy. Pomyślałem, że najpierw mogę trochę poczekać. Nie zdziwiłbym się między innymi, gdyby jakiś przedsiębiorczy członek społeczności wykopał duplikat wątku, który chciałbym dokładniej zbadać. W końcu jest to podstawowy materiał - wiele pytań dotyczyło testów dwumianowych. Jedynym twierdzeniem, które musi być nowe, jest to, że przybyło tutaj jako potrzeba testu mediany - więc na początku nie było to tak oczywiste badanie dwumianowe - i jedynym twierdzeniem, że moja odpowiedź jest godna czytanie polega na wyjaśnianiu każdego kroku.
whuber