Jeszcze jedno centralne pytanie dotyczące limitu

11

Niech będzie sekwencją niezależnych zmiennych losowych Bernoulliego z Ustaw Pokaż, że zbiega się w rozkładzie do standardowej zmiennej normalnej gdy dąży do nieskończoności.{Xn:n1}

P{Xk=1}=1P{Xk=0}=1k.
Sn=k=1n(Xk1k), Bn2=k=1nk1k2
SnBnZn

Moja próba użycia CLT Lyapunova, dlatego musimy pokazać, że istnieje taka, że δ>0

limn1Bn2+δk=1nE[|Xk1k|2+δ]=0.

Więc ustaw δ=1

k=1nE|Xkk1|3=k=1n(1k3k2+4k32k4)
i
Bn3=(k=1n1k1k2)(k=1n1k1k2)

Oceniając duże n na komputerze, pokazuje, w jaki sposób zarówno k=1nE|Xkk1|3 i Bn3 jak n . Ale Bn3 rośnie szybciej niż Bn2 więc k=1nE|Xkk1|3Bn30 . Czy ktoś może mi pomóc udowodnić, że ta konwergencja się utrzymuje?

TiffanyButterfly
źródło
7
To jest przykład 27.3 prawdopodobieństwa i miary autorstwa Patrick Billingsley.
Zhanxiong

Odpowiedzi:

10

Może to być pouczające, aby zademonstrować ten wynik na podstawie pierwszych zasad i podstawowych wyników , wykorzystując właściwości kumulatywnych funkcji generujących (dokładnie tak, jak w standardowych dowodach Twierdzenia o granicy centralnej). Wymaga to zrozumienia tempa wzrostu uogólnionych liczb harmonicznych dla Te szybkości wzrostu są dobrze znane i łatwe do uzyskania w porównaniu z całkami : są zbieżne dla a poza tym logarytmicznie rozchodzą się dla .

H(n,s)=k=1nks
s=1,2,.1nxsdxs>1s=1

Niech i . Z definicji funkcja generowania skumulowanego (cgf) wynosin21kn(Xk1/k)/Bn

ψk,n(t)=logE(exp(Xk1/kBnt))=tkBn+log(1+1+exp(t/Bn)k).

Rozwinięcie szeregu prawej strony, uzyskane z rozwinięcia wokół , przyjmuje postaćlog(1+z)z=0

ψk,n(t)=(k1)2k2Bn2t2+k23k+26k3Bn3t3++kj1±(j1)!j!kjBnjtj+.

Liczniki ułamków są wielomianami z wiodącym terminem . Ponieważ rozszerzenie dziennika jest całkowicie zbieżne dla , to rozszerzenie jest absolutnie zbieżne, kiedykkj1|1+exp(t/Bn)k|<1

|exp(t/Bn)1|<k.

(W przypadku, gdy zbiega się wszędzie.) Dla ustalonej wartości i rosnących wartości (oczywista) rozbieżność oznacza, że ​​dziedzina zbieżności absolutnej rośnie dowolnie duża. Zatem dla każdego stałego wystarczająco dużego ekspansja ta zbiega się absolutnie.k=1knBntn

Dla odpowiednio dużego możemy zatem zsumować indywidualny przez wyrażenie po terminie w potęgach aby otrzymać cgf ,nψk,nktSn/Bn

ψn(t)=k=1nψk,n(t)=12t2++1Bnj(k=1n(k1±(j1)!kj))tjj+.

Przyjmowanie terminów w sumach ponad pojedynczo wymaga oceny proporcjonalnych wyrażeńk

b(s,j)=1Bnjk=1nks

dla i . Korzystając z asymptotyków uogólnionych liczb harmonicznych wspomnianych we wstępie, łatwo to wynikaj3s=1,2,,j

Bn2=H(n,1)H(n,2)log(n)

że

b(1,j)(log(n))1j/20

i (dla )s>1

b(s,j)(log(n))j/20

gdy rośnie. W związku z tym wszystkie terminy w rozwinięciu poza zbieżne do zera, skąd zbieżne do dla dowolnej wartości . Ponieważ zbieżność cgf implikuje zbieżność funkcji charakterystycznej, wnioskujemy z twierdzenia Levy'ego o ciągłości, że zbliża się do zmiennej losowej, której cgf wynosi 2/2 : jest to standardowa zmienna normalna, QED .nψn(t)t2ψn(t)t2/2tSn/Bnt2/2


Analiza ta odkrywa, jak delikatna jest zbieżność: podczas gdy w wielu wersjach Centralnego Twierdzenia Granicznego współczynnik wynosi (dla ), tutaj współczynnik wynosi tylko : zbieżność jest znacznie wolniejsza W tym sensie sekwencja standardowych zmiennych „ledwo” staje się Normalna.tjO(n1j/2)j3O(((log(n))1j/2)

Tę powolną konwergencję możemy zobaczyć w serii symulacji. Histogramy wyświetlają niezależnych iteracji dla czterech wartości . Czerwone krzywe są wykresami standardowych funkcji gęstości normalnej do celów wizualnych. Chociaż ewidentnie istnieje stopniowa tendencja do normalności, nawet przy (gdzie jest wciąż znaczna), pozostaje znacząca nienormalność, o czym świadczy skośność (równa w tej próbce). (Nic dziwnego, że skośność tego histogramu jest zbliżona do , ponieważ właśnie tym jest termin w cgf.)105nn=1000(log(n))1/20.380.35(log(n))1/2t3

Rysunek: histogramy dla n = 30, 100, 300, 1000

Oto Rkod dla tych, którzy chcieliby dalej eksperymentować.

set.seed(17)
par(mfrow=c(1,4))
n.iter <- 1e5
for(n in c(30, 100, 300, 1000)) {
  B.n <- sqrt(sum(rev((((1:n)-1) / (1:n)^2))))
  x <- matrix(rbinom(n*n.iter, 1, 1/(1:n)), nrow=n, byrow=FALSE)
  z <- colSums(x - 1/(1:n)) / B.n
  hist(z, main=paste("n =", n), freq=FALSE, ylim=c(0, 1/2))
  curve(dnorm(x), add=TRUE, col="Red", lwd=2)
}
Whuber
źródło
6

Masz już świetną odpowiedź. Jeśli chcesz również wypełnić własny dowód, możesz argumentować w następujący sposób:

Ponieważ zbieżne dla wszystkich i rozbieżne dla ( tutaj ), możemy napisaćk=1n1/kii>1i=1

S(n):=k=1n(1k3k2+4k33k4)=k=1n1k+O(1).

Tym samym argumentem

Bn2=k=1n1k+O(1).

W konsekwencji a zatemS(n)/Bn2=O(1)

S(n)/Bn3=O(1)(Bn2)1/20,

co chcieliśmy pokazać.

ekvall
źródło
2

Po pierwsze, zmienne losowe nie są identycznie rozmieszczone, jeśli rozkłady zależą od ;)k

Nie twojej notacji jako:Bn

  • wielkie litery są zwykle zarezerwowane dla zmiennych losowych.
  • to tylko suma wariancji, więc użyłbym notacji zawierającej symbol aby uczynić to oczywistym.σ

Jeśli chodzi o pytanie, nie wiem, czy jest to ćwiczenie, czy badanie i jakich narzędzi możesz użyć. Jeśli nie próbujesz ponownie udowodnić znanych twierdzeń, powiem tylko, że jest to centralne twierdzenie graniczne dla niezależnych, nie identycznie rozmieszczonych, ale równomiernie ograniczonych RV i nazwij to dniem. Nie mam dobrego źródła pod ręką, ale nie powinno być trudno go znaleźć, na przykład spójrz na /mathpro/29508/is-there-a-central-limit-theorem- for-granice-nie-identycznie-dystrybuowane-losowo .

Edycja: Mój zły, oczywiście, jednolicie ograniczony warunek nie wystarczy, potrzebujesz też

k=1nσk2
Adrien
źródło