Jaka jest wariancja maksimum próbki?

13

Szukam granic wariancji maksimum zestawu zmiennych losowych. Innymi słowy, szukam formuł zamkniętych dla B , takich że

Var(maxiXi)B,
Gdzie X={X1,,XM} jest stałym zestawem M zmiennych losowych o skończonych środkach μ1,,μM i wariancje σ12,,σM2 .

Mogę wywnioskować, że ale ta granica wydaje się bardzo luźna. Test numeryczny wydaje się wskazywać, że może być możliwą możliwością, ale nie byłem w stanie tego udowodnić. Każda pomoc jest mile widziana.B = max i σ 2 i

Var(maxiXi)iσi2,
B=maxiσi2
Piotr
źródło
3
(Czy chcesz założyć, że są niezależne?) Przypuszczenie jest prawdopodobne, ale wydaje się fałszywe. Na przykład, wykonaj kilka prób, w których są identyczne z CDF , , . Wariancja ich maksimum, w stosunku do ich powszechnej wariancji, rośnie bez ograniczeń wraz ze wzrostemX i 1 - x 1 - s 1 x s > 3XiXi1x1s1xs>3M
whuber
@ Whuber Dzięki, to wyjaśnia, dlaczego nie byłem w stanie udowodnić tej przypuszczenia :) Naprawdę interesuje mnie przypadek, w którym są niezależne. Aby wyjaśnić, najbardziej interesują mnie ogólne granice, które wykorzystują tylko pierwsze dwa momenty. Nie jestem pewien, czy w ogóle istnieją ostrzejsze ogólne granice niż wspólna wariancja. Xi
Peter
1
Powinienem zauważyć, że twoja suma związana (zakładając, że jest poprawna - miło byłoby zobaczyć szkic dowodu) jest ścisła. Na przykład, niech będą obsługiwane w przedziale przy odchyleniach nieprzekraczających i niech będzie obsługiwane w . Następnie as, z wariancją , ale nierówność można zaostrzyć dowolnie poprzez zmniejszenie . [ - , a ] ε 2 X 1 [ a , ] max i X i = X 1 σ 2 1σ 2 1 + ( M - 1 ) ε 2 ε 2X2,,XM[,a]ε2X1[a,]maxiXi=X1σ12σ12+(M1)ε2ε2
whuber
1
W przypadku danych id, teoria ekstremalnych wartości zapewnia klasy rozkładów, z którymi zbiega się maksimum próbki, z pewnymi warunkami na ogonach pierwotnych rozkładów, dając różne klasy rozkładów asymptotycznych. Wątpię więc, abyś był w stanie wyprowadzić dobrą więź opartą tylko na dwóch momentach, chociaż ja tylko stycznie znam teorię.
StasK

Odpowiedzi:

9

Dla dowolnej zmiennych losowych najlepszym ogólnym ograniczeniem jest jak podano w pierwotnym pytaniu. Oto szkic próbny: jeśli X, Y są IID, to . Biorąc pod uwagę wektor zmiennych zależnych , niech będzie niezależnym wektorem o tym samym rozkładzie połączeń. Dla dowolnego mamy związkową granicę, że , a całkowanie tego od do daje nierówność.X inXiE [ ( X - Y ) 2 ] = 2 V a r ( X ) ( X 1 , , X n ) ( Y 1 , , Y n ) r > 0 P [Var(maxXi)iVar(Xi)E[(XY)2]=2Var(X)(X1,,Xn)(Y1,,Yn)r>0d r 0 P[|maxiXimaxiYi|2>r]iP[|XiYi|2>r]dr0

Jeśli są wskaźnikami IID zdarzeń prawdopodobieństwa , to jest wskaźnikiem zdarzenia prawdopodobieństwa . Naprawiając i pozwalając, by do zera, otrzymujemy i . ϵ max X i n ϵ + O ( n 2 ϵ 2 ) n ϵ V a r ( X i ) = ϵ - ϵ 2 V a r ( max i X i ) = n ϵ + O ( n 2 ϵ 2 )XiϵmaxXinϵ+O(n2ϵ2)nϵVar(Xi)=ϵϵ2Var(maxiXi)=nϵ+O(n2ϵ2)

Yuval Peres
źródło
3

Pytanie dotyczące MathOverflow jest powiązane z tym pytaniem.

W przypadku zmiennych losowych IID ta najwyższa nazywana jest statystyką rzędu .k

Nawet w przypadku zmiennych losowych IID Bernoulli wariancja dowolnej statystyki rzędu innej niż mediana może być większa niż wariancja populacji. Na przykład, jeśli wynosi z prawdopodobieństwem i z prawdopodobieństwem a , wówczas maksimum wynosi z prawdopodobieństwem , więc wariancja populacji wynosi podczas gdy wariancja maksimum wynosi około . 1 1 / 10 0 9 / 10 M = 10 1 1 - 1 / E 0,09 0,23Xi11/1009/10M=10111/e0.090.23

Oto dwa artykuły na temat wariancji statystyk zamówień:

Yang, H. (1982) „O wariancjach mediany i niektórych innych statystyk porządkowych”. Byk. Inst. Matematyka Acad Sinica, 10 (2) s. 197–204

Papadatos, N. (1995) „Maksymalna wariancja statystyki zamówień”. Ann. Inst. Statystyk. Math., 47 (1) s. 185–193

Wierzę, że górną granicą wariancji maksimum w drugim artykule jest . Wskazują, że równość nie może wystąpić, ale dla zmiennych losowych Bernoulliego IID może wystąpić dowolna niższa wartość.Mσ2

Douglas Zare
źródło