Zastanów się
gdzie to iid, a CLT jest wstrzymany.
Ile z największych warunków stanowi połowę łącznej kwoty?
Na przykład 10 + 9 + 8 (10 + 9 + 8 + 1) / 2: 30% haseł osiąga około połowy sumy.
Zdefiniuj
Czy istnieje ogólny asymptotyczny wynik dla połowy sumy ( )?
Proste, intuicyjne wyprowadzenie byłoby fajne.
(Trochę Monte Carlo sugeruje, że czasami połowa sumy ( ) / 4 lub tak;
to znaczy, że największa 1/4 z sumuje się do 1/2 całości.
Dostaję 0,24 dla półnormalnego, 0,19 dla wykładniczy, dla = 20, 50, 100.)≈ N X i N N N
Odpowiedzi:
Nie, nie ma ogólnego wyniku asymptotycznego. Niech będą uporządkowane , gdzie jest największym. x i x [ 1 ]x[ 1 ]… X[ N] xja x[ 1 ]
Rozważ następujące dwa przykłady:
1) . Najwyraźniej CLT trzyma się. Potrzebujesz tylko obserwacji dla. M = 1 ∑ M j = 1 | x [ j ] | ≥ 1P.( x = 0 ) = 1 M.= 1 ∑Mj=1|x[j]|≥12∑N|xi|
2) . Najwyraźniej CLT trzyma się. Potrzebujesz obserwacji dla.M = ⌈ N / 2 ⌉ ∑ M j = 1 | x [ j ] | ≥ 1P(x=1)=1 M=⌈N/2⌉ ∑Mj=1|x[j]|≥12∑N|xi|
Na przykład nietrywialny rozkład Bernoulliego:
3) . Po raz kolejny CLT trzyma się. Potrzebujesz obserwacji, aby spełnić twoje warunki. Zmieniając pomiędzy 0 i 1, możesz zbliżyć się do przykładu 1 lub przykładu 2, jak chcesz.⌈P(x=1)=p, P(x=0)=1−p p⌈pN/2⌉ p
źródło
Oto prymitywny argument podający nieco inne oszacowanie dla równomiernie rozmieszczonych zmiennych losowych. Załóżmy, że są ciągłymi zmiennymi losowymi równomiernie rozmieszczonymi na . Wtedy ma średnią wartość . Załóżmy, że przez zaskakujący i całkowicie niewiarygodny zbieg okoliczności suma jest dokładnie równa . Chcemy więc oszacować, ile z największych wartości sumuje się do lub więcej. Teraz histogram próbek ( bardzo dużych) narysowanych z rozkładu jednorodności jest z grubsza płaski od do [ 0 , 1 ] ∑ i X i N / 2 N / 2 X N / 4 N N U [Xi [0,1] ∑iXi N/2 N/2 X N/4 N N 0 1U[0,1] 0 1 , i tak dla każdego , , istnieje
próbek rozmieszczonych w przybliżeniu równomiernie między do . Próbki te mają średnią wartość i sumę równą
. Suma przekracza dla . Tak więc suma największych próbek przekracza
.0 < x < 1 ( 1 - x ) N x 1 ( 1 + x ) / 2 ( 1 - x ) N ( 1 +x 0<x<1 (1−x)N x 1 (1+x)/2 N / 4 x ≤ 1 / √(1−x)N(1+x)/2)=(1−x2)N/2 N/4 (1-1/ √x≤1/2–√ N/4(1−1/2–√)N≈0.3N N/4
Możesz spróbować to trochę uogólnić. Jeśli , to dla dowolnego chcemy, aby było takie, że gdzie jest normalne ze średnią i wariancją . Tak więc, zależnie od wartości , . Pomnóż przez gęstość i zintegruj (od do ), aby znaleźć średnią liczbę największych próbek, która przekroczy połowę losowej sumy.Y x∑iXi=Y Y x Y N / 2 N / 12 Y x = √(1−x2)N/2=Y/2 Y N/2 N/12 Y YY=0Y=Nx=1−(Y/N)−−−−−−−−−√ Y Y=0 Y=N
źródło
Załóżmy, że X ma tylko wartości dodatnie, aby pozbyć się wartości bezwzględnej.
Bez dokładnego udowodnienia, myślę, że musisz rozwiązać k
a następnie odpowiedź jest udzielana przez przyjęcie najwyższych wartości .n(1−FX(k))
Moja logika jest taka, że asymetrycznie suma wszystkich wartości wyższych niż k powinna być o
i asymetrycznie połowa całkowitej sumy wynosi około
Symulacja numeryczna pokazuje, że wynik dotyczy przypadku jednolitego (jednolity w ), gdzie a ja otrzymuję . Nie jestem pewien, czy wynik zawsze się utrzymuje, czy też można go uprościć, ale myślę, że tak naprawdę zależy on od funkcji rozkładu F.F ( k ) = k k = √[0,1] F(k)=k k=(√12)
źródło