Dlaczego asymptotyczna wydajność względna testu Wilcoxona

13

Powszechnie wiadomo, że asymptotyczna wydajność względna (ARE) testu rang ze znakiem Wilcoxona wynosi porównaniu z testem t- Studenta, jeśli dane pochodzą z populacji o rozkładzie normalnym. Dotyczy to zarówno podstawowego testu z jedną próbką, jak i wariantu dla dwóch niezależnych próbek (Wilcoxon-Mann-Whitney U). Jest to również ARE testu Kruskala-Wallisa w porównaniu z testem ANOVA F , dla normalnych danych.3π0.955

Czy ten niezwykły (jak dla mnie, jeden z „ najbardziej nieoczekiwanych wystąpieńπ ”) i niezwykle prosty wynik ma wnikliwy, niezwykły lub prosty dowód?

Silverfish
źródło
Biorąc pod uwagę pojawienie się π na normalnym cdf, pojawienie się π w ARE nie powinno być tak zaskakujące. Zaryzykuję odpowiedź, ale zajmie trochę czasu, aby zrobić dobrą.
Glen_b
1
@Glen_b Rzeczywiście - widziałem już dyskusję „dlaczego pojawia się tak często w statystykach” (choć nie pamiętam, czy było to w CV czy nie) i „z powodu normalnej dystrybucji” wiem, że dużo się pojawia, ale 3 / π jest wciąż przyjemnie zaskakujące, kiedy go zobaczysz po raz pierwszy. Dla porównania ARE testu t Manna-Whitneya w porównaniu z dwiema próbkami wynosi 3 dla danych wykładniczych, 1,5 dla podwójnej wykładniczej i 1 dla jednolitego - znacznie bardziej okrągłe! π3/π
Silverfish
1
@Silverfish Połączyłem stronę 197 van der Vaart „Asymptotic Statistics”. W przypadku jednej próbki testy znakowe mają ARE stosunku do testu t. 2/π
Khashaa
1
@Silverfish ... a logistycznie to . Istnieje całkiem sporo znanych ARE (w jednym lub dwóch przykładowych przypadkach) obejmujących π i całkiem sporo, które są prostymi stosunkami liczb całkowitych. (π/3)2π
Glen_b
1
W przypadku testu rang podpisanych jedną próbą wydaje się, że wynosi . W przypadku testu znakowego na jednej próbce jest to 2 / π . Wyjaśniliśmy więc naszą pozycję. Myślę, że to dobry znak. 3/π2/π
Khashaa

Odpowiedzi:

10

Krótki szkic ARE dla testu z jedną próbką , testu z podpisem i testu z podpisaną rangąt

Oczekuję, że długa wersja odpowiedzi @ Glen_b zawiera szczegółową analizę testu rang podpisanych dwoma próbami wraz z intuicyjnym wyjaśnieniem ARE. Więc pominę większość pochodnych. (przypadek jednej próby, brakujące dane można znaleźć w Lehmann TSH).

Problem testowy : Niech będzie losową próbką z modelu lokalizacji f ( x - θ ) , symetryczną względem zera. Mamy obliczyć ARE podpisanego testu, podpisanego testu rangi dla hipotezy H 0 : θ = 0 względem testu t.X1,,Xnf(xθ)H0:θ=0

Aby ocenić względną wydajność testów, brane są pod uwagę tylko lokalne alternatywy, ponieważ spójne testy mają moc zmierzającą do 1 w stosunku do stałej alternatywy. Lokalne alternatywy, które powodują nietrywialną asymptotyczną moc, często mają formę dla ustalonegoh, któryw literaturzenazywa siędryftem Pitmana.θn=h/nh

Przed nami nasze zadanie

  • znajdź rozkład graniczny każdej statystyki testowej poniżej wartości zerowej
  • znaleźć rozkład graniczny każdej statystyki testu w ramach alternatywy
  • obliczyć lokalną asymptotyczną moc każdego testu

Testuj statystyki i asymptotyki

  1. test t (biorąc pod uwagę istnienie ) t n = σt n =
    tn=nX¯σ^dN(0,1)under the null
    tn=nX¯σ^dN(h/σ,1)under the alternative θ=h/n
    • więc test, który odrzuca, jeśli ma asymptotyczną funkcję mocy 1 - Φ ( z α - h 1tn>zα
      1Φ(zαh1σ)
  2. test podpisany Sn=1ni=1n1{Xi>0}
    n(Sn12)dN(0,14)under the null 
    i ma lokalną moc asymptotyczną 1 - Φ ( z α - 2 h f ( 0 ) )
    n(Sn12)dN(hf(0),14)under the alternative 
    1Φ(zα2hf(0))
  3. Test zarejestrowany Stopień W n d N ( 2 h f 2 , 1
    Wn=n2/3i=1nRi1{Xi>0}dN(0,13)under the null 
    i ma lokalną moc asymptotyczną 1 - Φ ( z α -
    WndN(2hf2,13)under the alternative 
    1Φ(zα12hf2)

Dlatego A R E ( W n ) = (

ARE(Sn)=(2f(0)σ)2
Jeżelifjest standardową gęstością normalną,ARE(Sn)=2/π,ARE(Wn)=3/π
ARE(Wn)=(12f2σ)2
fARE(Sn)=2/πARE(Wn)=3/π

Jeśli jest jednolita w [-1,1] R E ( S n ) = 1 / 3 , R e ( szer n ) = 1 / 3fARE(Sn)=1/3ARE(Wn)=1/3

Uwaga na temat wyprowadzenia dystrybucji w ramach alternatywy

Istnieje oczywiście wiele sposobów uzyskania ograniczającego rozkładu w ramach alternatywy. Jednym ogólnym podejściem jest użycie trzeciego lematu Le Cam. Uproszczona wersja stwierdza

ΔnWn

(Wn,Δn)dN[(μσ2/2),(σW2ττσ2/2)]
WndN(μ+τ,σW2)under the alternative

cov(Wn,Δn)Δn

Δnhni=1nl(Xi)12h2I0
lI0Sn
cov(n(Sn1/2),Δn)=hcov(1{Xi>0},ff(Xi))=h0f=hf(0)
Khashaa
źródło
+1 Nie zamierzałem wchodzić w tak szczegółowe szczegóły (w rzeczywistości, z twoją odpowiedzią, która już całkiem ładnie obejmuje rzeczy, prawdopodobnie nie dodam niczego do tego, co mam teraz), więc jeśli chcesz podać więcej szczegółów, nie mów wstrzymaj się z moim kontem. Byłbym jeszcze kilka dni (i wciąż za mniej niż ty), więc dobrze, że przyszedłeś.
Glen_b
To ładna odpowiedź, szczególnie w przypadku dodania lematu Le Cam (+1). Wydaje mi się, że jest dość duży skok między ustaleniem asymptotyków w 1, 2 i 3, a bitem „dlatego”, w którym piszesz ARE. Myślę, że gdybym to pisał, zdefiniowałbym skuteczność asymptotyczną w tym punkcie (a może wcześniej, więc wynikiem punktów 1, 2 i 3 byłyby AE nie tylko lokalne moce asymptotyczne w każdym przypadku), a następnie krok do ARE byłoby znacznie łatwiejsze dla przyszłych czytelników.
Silverfish
H1
Zmodyfikuj moją odpowiedź lub dołącz ją do PO.
Khashaa
1
6

πtYtnπ3

n <- 1000000; x <- qnorm((1:n)/(n+1)); cor(1:n, x)^2; 3/pi
[1] 0.9549402
[1] 0.9549297
n <- 100000000; x <- qnorm((1:n)/(n+1)); cor(1:n, x)^2; 3/pi
[1] 0.9549298
[1] 0.9549297
Frank Harrell
źródło
To jest rzeczywiście bardzo pomocny komentarz. Czy jest to nieco bardziej koncepcyjnie bliższe n <- 1e6; x <- rnorm(n); cor(x, rank(x))^2(co oczywiście daje ten sam rezultat)?
Silverfish,
(Ludzie zaintrygowani komentarzem Franka mogą chcieć przyjrzeć się temu pytaniu o równoważności Wilcoxona-Manna-Whitneya U i t -teście w szeregach .)
Silverfish
nnn
O ile pamiętam, wydajność małej próbki zarówno testu rangowego podpisanego przez Wilcoxona, jak i WMW jest nieco niższa niż wartość asymptotyczna dla alternatywnych zmian w rozkładzie normalnym.
Glen_b
5

12σ2[f2(x)dx]2fσ

f2f1ππ

Ten sam termin - z tą samą całką - bierze udział w ARE dla podpisanego testu rangi, więc przyjmuje tę samą wartość.

4σ2f(0)2f(0)2π

π

Odniesienie:

JL Hodges i EL Lehmann (1956),
„Skuteczność niektórych nieparametrycznych konkurentów testu t”,
Ann. Matematyka Statystyk. , 27 : 2, 324–335.

Glen_b - Przywróć Monikę
źródło
π
f2dx
α=2