Dlaczego asymptotyczna wydajność względna testu Wilcoxona

Powszechnie wiadomo, że asymptotyczna wydajność względna (ARE) testu rang ze znakiem Wilcoxona wynosi porównaniu z testem t- Studenta, jeśli dane pochodzą z populacji o rozkładzie normalnym. Dotyczy to zarówno podstawowego testu z jedną próbką, jak i wariantu dla dwóch niezależnych próbek (Wilcoxon-Mann-Whitney U). Jest to również ARE testu Kruskala-Wallisa w porównaniu z testem ANOVA F , dla normalnych danych. $\frac{3}{\pi} \approx 0.955$

Czy ten niezwykły (jak dla mnie, jeden z „ najbardziej nieoczekiwanych wystąpień $\pi$ ”) i niezwykle prosty wynik ma wnikliwy, niezwykły lub prosty dowód?

nonparametric wilcoxon-mann-whitney asymptotics efficiency wilcoxon-signed-rank Silverfish
źródło

Biorąc pod uwagę pojawienie się

π

$\pi$ na normalnym cdf, pojawienie się

π

$\pi$ w ARE nie powinno być aż tak zaskakujące. Zaryzykuję odpowiedź, ale zajmie trochę czasu, aby zrobić dobrą.

Glen_b

@Glen_b Rzeczywiście - widziałem już dyskusję „dlaczego

pojawia się tak często w statystykach” (choć nie pamiętam, czy było to w CV czy nie) i „z powodu normalnej dystrybucji” wiem, że dużo się pojawia, ale

jest wciąż przyjemnie zaskakujące, kiedy go zobaczysz po raz pierwszy. Dla porównania ARE testu t Manna-Whitneya w porównaniu z dwiema próbkami wynosi 3 dla danych wykładniczych, 1,5 dla podwójnej wykładniczej i 1 dla jednolitego - znacznie bardziej okrągłe!

π

$\pi$

3 / π

$3/\pi$

Silverfish

@Silverfish Połączyłem stronę 197 van der Vaart „Asymptotic Statistics”. W przypadku jednej próbki testy znakowe mają ARE

stosunku do testu t.

2 / π

$2/\pi$

Khashaa

@Silverfish ... a logistycznie to

. Istnieje całkiem sporo znanych ARE (w jednym lub dwóch przykładowych przypadkach) obejmujących

i całkiem sporo, które są prostymi stosunkami liczb całkowitych.

(π / 3)^{2}

$(\pi/3)^2$

π

$\pi$

Glen_b

W przypadku testu rang podpisanych jedną próbą wydaje się, że wynosi

. W przypadku testu znakowego na jednej próbce jest to

. Wyjaśniliśmy więc naszą pozycję. Myślę, że to dobry znak.

3 / π

$3/\pi$

2 / π

$2/\pi$

Khashaa

Odpowiedzi:

Krótki szkic ARE dla testu z jedną próbką , testu z podpisem i testu z podpisaną rangą $t$

Oczekuję, że długa wersja odpowiedzi @ Glen_b zawiera szczegółową analizę testu rang podpisanych dwoma próbami wraz z intuicyjnym wyjaśnieniem ARE. Więc pominę większość pochodnych. (przypadek jednej próby, brakujące dane można znaleźć w Lehmann TSH).

Problem testowy : Niech będzie losową próbką z modelu lokalizacji , symetryczną względem zera. Mamy obliczyć ARE podpisanego testu, podpisanego testu rangi dla hipotezy względem testu t. $X_1,\ldots,X_n$ $f(x-\theta)$ $H_0: \theta=0$

Aby ocenić względną wydajność testów, brane są pod uwagę tylko lokalne alternatywy, ponieważ spójne testy mają moc zmierzającą do 1 w stosunku do stałej alternatywy. Lokalne alternatywy, które powodują nietrywialną asymptotyczną moc, często mają formę dla ustalonego, któryw literaturzenazywa siędryftem Pitmana. $\theta_n=h/\sqrt{n}$ $h$

Przed nami nasze zadanie

znajdź rozkład graniczny każdej statystyki testowej poniżej wartości zerowej
znaleźć rozkład graniczny każdej statystyki testu w ramach alternatywy
obliczyć lokalną asymptotyczną moc każdego testu

Testuj statystyki i asymptotyki

test t (biorąc pod uwagę istnienie ) t n = √t n = √
$t_{n} = \sqrt{n} \frac{\bar{X}}{\hat{σ}} \to_{d} N (0, 1) under the null$

$t_{n} = \sqrt{n} \frac{\bar{X}}{\hat{σ}} \to_{d} N (h / σ, 1) under the alternative θ = h / \sqrt{n}$
- więc test, który odrzuca, jeśli ma asymptotyczną funkcję mocy $t_n>z_\alpha$ $1 - Φ (z_{α} - h \frac{1}{σ})$ $1-\Phi\left(z_\alpha-h\frac{1}{\sigma}\right)$
test podpisany $S_n=\frac{1}{n}\sum_{i=1}^{n}1\{X_i>0\}$ $\sqrt{n} (S_{n} - \frac{1}{2}) \to_{d} N (0, \frac{1}{4}) under the null$ $\sqrt{n}\left(S_n-\frac{1}{2}\right)\to_dN\left(0,\frac{1}{4}\right)\quad \text{under the null }$ i ma lokalną moc asymptotyczną $\sqrt{n} (S_{n} - \frac{1}{2}) \to_{d} N (h f (0), \frac{1}{4}) under the alternative$ $\sqrt{n}\left(S_n-\frac{1}{2}\right)\to_dN\left(hf(0),\frac{1}{4}\right)\quad \text{under the alternative }$ $1 - Φ (z_{α} - 2 h f (0))$ $1-\Phi\left(z_\alpha-2hf(0)\right)$
Test zarejestrowany Stopień $W_{n} = n^{- 2 / 3} \sum_{i = 1}^{n} R_{i} 1 {X_{i} > 0} \to_{d} N (0, \frac{1}{3}) under the null$ $W_n=n^{-2/3}\sum_{i=1}^{n}R_i1\{X_i>0\}\to_dN\left(0,\frac{1}{3}\right)\quad \text{under the null }$ i ma lokalną moc asymptotyczną $W_{n} \to_{d} N (2 h \int f^{2}, \frac{1}{3}) under the alternative$ $W_n\to_dN\left(2h\int f^2,\frac{1}{3}\right)\quad \text{under the alternative }$ $1 - Φ (z_{α} - \sqrt{12} h \int f^{2})$ $1-\Phi\left(z_\alpha-\sqrt{12}h\int f^2\right)$

Dlatego

A R E (S_{n}) = (2 f (0) σ)^{2}

$ARE(S_n)=(2f(0)\sigma)^2$

Jeżeli

jest standardową gęstością normalną,

A R E (W_{n}) = (\sqrt{12} \int f^{2} σ)^{2}

$ARE(W_n)=(\sqrt{12}\int f^2\sigma)^2$

f

$f$

A R E (S_{n}) = 2 / π

$ARE(S_n)=2/\pi$

A R E (W_{n}) = 3 / π

$ARE(W_n)=3/\pi$

Jeśli jest jednolita w [-1,1] , $f$ $ARE(S_n)=1/3$ $ARE(W_n)=1/3$

Uwaga na temat wyprowadzenia dystrybucji w ramach alternatywy

Istnieje oczywiście wiele sposobów uzyskania ograniczającego rozkładu w ramach alternatywy. Jednym ogólnym podejściem jest użycie trzeciego lematu Le Cam. Uproszczona wersja stwierdza

$\Delta_n$ $W_n$
$(W_{n}, Δ_{n}) \to_{d} N [(\begin{matrix} μ \\ - σ^{2} / 2 \end{matrix}), (\begin{array}{cc} σ_{W}^{2} & τ \\ τ & σ^{2} / 2 \end{array})]$ $(W_n,\Delta_n)\to_d N\left[\left(\begin{array}{c} \mu\\ -\sigma^2/2 \end{array}\right),\left(\begin{array}{cc} \sigma^2_W & \tau \\ \tau & \sigma^2/2 \end{array}\right)\right]\\$ $W_{n} \to_{d} N (μ + τ, σ_{W}^{2}) under the alternative$ $W_n\to_d N\left(\mu+\tau,\sigma^2_W\right)\quad\text{under the alternative}$

$\mathrm{cov}(W_n,\Delta_n)$ $\Delta_n$

Δ_{n} \approx \frac{h}{\sqrt{n}} \sum_{i = 1}^{n} l (X_{i}) - \frac{1}{2} h^{2} I_{0}

$\Delta_n\approx \frac{h}{\sqrt{n}}\sum_{i=1}^{n}l(X_i)-\frac{1}{2}h^2I_0$

l

$l$

I_{0}

$I_0$

S_{n}

$S_n$

c o v (\sqrt{n} (S_{n} - 1 / 2), Δ_{n}) = - h c o v (1 {X_{i} > 0}, \frac{f^{'}}{f} (X_{i})) = h \int_{0}^{\infty} f^{'} = h f (0)

$\mathrm{cov}(\sqrt{n}(S_n-1/2),\Delta_n)=-h\mathrm{cov}\left(1\{X_i>0\},\frac{f'}{f}(X_i)\right)=h\int_0^\infty f'=hf(0)$

Khashaa
źródło

+1 Nie zamierzałem wchodzić w tak szczegółowe szczegóły (w rzeczywistości, z twoją odpowiedzią, która już całkiem ładnie obejmuje rzeczy, prawdopodobnie nie dodam niczego do tego, co mam teraz), więc jeśli chcesz podać więcej szczegółów, nie mów wstrzymaj się z moim kontem. Byłbym jeszcze kilka dni (i wciąż za mniej niż ty), więc dobrze, że przyszedłeś.

Glen_b

To ładna odpowiedź, szczególnie w przypadku dodania lematu Le Cam (+1). Wydaje mi się, że jest dość duży skok między ustaleniem asymptotyków w 1, 2 i 3, a bitem „dlatego”, w którym piszesz ARE. Myślę, że gdybym to pisał, zdefiniowałbym skuteczność asymptotyczną w tym punkcie (a może wcześniej, więc wynikiem punktów 1, 2 i 3 byłyby AE nie tylko lokalne moce asymptotyczne w każdym przypadku), a następnie krok do ARE byłoby znacznie łatwiejsze dla przyszłych czytelników.

Silverfish

H_{1}

$H_1$

Zmodyfikuj moją odpowiedź lub dołącz ją do PO.

Khashaa

*

$*$

$\pi$ $t$ $Y$ $t$ $n\rightarrow \infty$ $\frac{\pi}{3}$

n <- 1000000; x <- qnorm((1:n)/(n+1)); cor(1:n, x)^2; 3/pi
[1] 0.9549402
[1] 0.9549297
n <- 100000000; x <- qnorm((1:n)/(n+1)); cor(1:n, x)^2; 3/pi
[1] 0.9549298
[1] 0.9549297

Frank Harrell
źródło

To jest rzeczywiście bardzo pomocny komentarz. Czy jest to nieco bardziej koncepcyjnie bliższe n <- 1e6; x <- rnorm(n); cor(x, rank(x))^2(co oczywiście daje ten sam rezultat)?

Silverfish,

(Ludzie zaintrygowani komentarzem Franka mogą chcieć przyjrzeć się temu pytaniu o równoważności Wilcoxona-Manna-Whitneya U i t -teście w szeregach .)

Silverfish

n

$n$

n

$n$

n

$n$

O ile pamiętam, wydajność małej próbki zarówno testu rangowego podpisanego przez Wilcoxona, jak i WMW jest nieco niższa niż wartość asymptotyczna dla alternatywnych zmian w rozkładzie normalnym.

Glen_b

$12\sigma^2[\int f^2(x) dx]^2$ $f$ $\sigma$

$f^2$ $f$ $\frac{1}{\sqrt{\pi}}$ $\frac{ \;}{\pi}$

Ten sam termin - z tą samą całką - bierze udział w ARE dla podpisanego testu rangi, więc przyjmuje tę samą wartość.

$4\sigma^2f(0)^2$ $f(0)^2$ $\frac{ \;}{\pi}$

$\pi$

Odniesienie:

JL Hodges i EL Lehmann (1956),
„Skuteczność niektórych nieparametrycznych konkurentów testu t”,
Ann. Matematyka Statystyk. , 27 : 2, 324–335.

Glen_b - Przywróć Monikę
źródło

π

$\pi$

\int f^{2} d x

$\int f^2 dx$

α = 2

$\alpha=2$