Mam dwie próbki danych, próbkę wyjściową i próbkę do leczenia.
Hipoteza jest taka, że próbka do leczenia ma wyższą średnią niż próbka wyjściowa.
Obie próbki mają kształt wykładniczy. Ponieważ dane są dość duże, mam tylko średnią i liczbę elementów dla każdej próbki w momencie, w którym będę przeprowadzał test.
Jak mogę przetestować tę hipotezę? Zgaduję, że jest to bardzo łatwe i natknąłem się na kilka odniesień do korzystania z testu F, ale nie jestem pewien, jak mapują parametry.
hypothesis-testing
statistical-significance
exponential
Jonathan Dobbie
źródło
źródło
Odpowiedzi:
Możesz przetestować równość średnich parametrów w porównaniu z alternatywą, że średnie parametry są nierówne za pomocą testu współczynnika wiarygodności (test LR). (Jeśli jednak średnie parametry się różnią, a rozkład jest wykładniczy, oznacza to przesunięcie skali, a nie przesunięcie lokalizacji).
W przypadku testu jednostronnego (ale tylko asymptotycznie w przypadku dwustronnym) uważam, że test LR okazuje się być równoważny z poniższym (aby pokazać, że w rzeczywistości jest on taki sam jak test LR dla jednostronnego gdyby trzeba było pokazać, że statystyka LR była monotoniczna w ):x¯/y¯
Załóżmy, że sparametryzujemy tą obserwację w pierwszym wykładniczym jako posiadającą pdf a tą obserwację w drugiej próbce jako posiadającą pdf (ponad oczywistymi domenami dla obserwacji i parametrów). (Dla jasności pracujemy tutaj w formie średniej, a nie w formie stawki; nie wpłynie to na wynik obliczeń).1 / μ x exp ( - x i / μ x )i 1/μxexp(−xi/μx) 1 / μ y exp ( - y j / μ y )j 1/μyexp(−yj/μy)
Ponieważ rozkład jest szczególnym przypadkiem gamma, , rozkład sumy , jest dystrybuowany ; podobnie, że dla sumy , jest . Γ ( 1 , μ x ) X S x Γ ( n x , μ x ) Y S y Γ ( n y , μ y )Xi Γ(1,μx) X Sx Γ(nx,μx) Y Sy Γ(ny,μy)
Ze względu na związek między rozkładami gamma a rozkładami chi-kwadrat okazuje się, że rozkład jest rozkładany . Stosunek dwóch kwadratów chi do ich stopni swobody wynosi F. Stąd stosunek, .2/μxSx χ22nx μyμxSx/nxSy/ny∼F2nx,2ny
Zgodnie z hipotezą zerową równości średnich, , a pod dwustronną alternatywą wartości mogą być mniejsze lub większe niż wartość z wartości zerowej dystrybucja, więc potrzebujesz dwustronnego testu.x¯/y¯∼F2nx,2ny
Symulacja, aby sprawdzić, czy nie popełniliśmy prostego błędu w algebrze:
Tutaj przeprowadziłem symulację 1000 próbek o wielkości 30 dla i 20 dla z rozkładu wykładniczego o tej samej średniej i obliczyłem powyższą statystykę średnich średnich.X Y
Poniżej znajduje się histogram rozkładu wynikowego, a także krzywa pokazująca rozkład obliczony pod wartością zerową:F
Przykład z omówieniem obliczania dwustronnych wartości p :
Aby zilustrować obliczenia, oto dwie małe próbki z rozkładów wykładniczych. Próbka X ma 14 obserwacji z populacji ze średnią 10, próbka Y ma 17 obserwacji z populacji ze średnią 15:
Średnie próbki wynoszą odpowiednio 12,082 i 16,077. Stosunek średnich wynosi 0,7515
Obszar po lewej stronie jest prosty, ponieważ znajduje się w dolnym ogonie (obliczenia w R):
Potrzebujemy prawdopodobieństwa dla drugiego ogona. Gdyby rozkład był symetryczny odwrotnie, byłoby to proste.
Powszechną konwencją ze stosunkiem wariancji testu F (który jest podobnie dwustronny) jest po prostu podwojenie jednostronnej wartości p (faktycznie to, co dzieje się tutaj ; tutaj wydaje się, że tak się dzieje na przykład w R ); w tym przypadku daje wartość p 0,44.
Jeśli jednak zrobisz to z formalną regułą odrzucenia, umieszczając obszar w każdym ogonie, otrzymasz wartości krytyczne, jak opisano tutaj . Wartość p jest wówczas największą , która prowadziłaby do odrzucenia, co jest równoważne dodaniu jednostronnej wartości p powyżej do jednostronnej wartości p w drugim ogonie dla zamienionych stopni swobody. W powyższym przykładzie daje to wartość p 0,43.α/2 α
źródło
Jako dodatek do odpowiedzi @ Glen_b współczynnik prawdopodobieństwa wynosi które można zmienić na gdzie . Przy występuje jedno minimum , więc test F jest rzeczywiście testem prawdopodobieństwa w stosunku do jednostronnych alternatyw dla hipotezy zerowej o identycznych rozkładach.
Aby wykonać test współczynnika wiarygodności właściwy dla dwustronnej alternatywy, nadal możesz użyć rozkładu F. po prostu musisz znaleźć drugą wartość współczynnika próbki dla którego iloraz prawdopodobieństwa jest równy obserwowanemu współczynnikowi , a następnie . W tym przykładzie , & , co daje ogólną wartość p wynoszącą (raczej zbliżoną do tej uzyskanej przez przybliżenie chi-kwadrat do rozkład dwukrotności ilorazu wiarygodności, ).rELR robs Pr(R>rELR) rELR=1.3272 Pr(R>rELR)=0.2142 0.4352 0.4315
Ale podwojenie jednostronnej wartości p jest być może najczęstszym sposobem uzyskania dwustronnej wartości p: jest to równoważne ze znalezieniem wartości stosunku próbka oznacza dla którego prawdopodobieństwo ogona jest równe , a następnie znalezieniu . Wyjaśnione w ten sposób może wydawać się, że stawia wózek przed koniem, pozwalając prawdopodobieństwu ogona określić skrajność statystyki testowej, ale można to uzasadnić jako dwa testy jednostronne (każdy LRT) z wieloma porównaniami korekta - i ludzie zwykle są zainteresowani twierdzeniem, że lub żerETP Pr(R>rETP) Pr(R<robs) μ x > μ y μ x < μ y μ x > μ y μ x < μ yPr(R>rETP) μx>μy μx<μy μx>μy lub . Jest to również mniej kłopotliwe, a nawet w przypadku dość małych próbek, daje prawie taką samą odpowiedź, jak właściwy dwustronny LRT.μx<μy
Poniższy kod R:
źródło