Pośredni sposób jest następujący:
dla absolutnie ciągłych dystrybucji Richard von Mises (w artykule z 1936 r. „La Distribution de la plus grande de n valeurs” , który wydaje się być odtworzony - w języku angielskim? - w wydaniu z 1964 roku z wybranymi jego dokumenty), zapewnił następujący wystarczający warunek, aby maksimum próbki zbliżyło się do standardowego Gumbela, G(x) :
Niech będzie wspólną funkcją rozkładu iid zmiennych losowych, a ich wspólną gęstością. A następnie, jeślinF(x)nf(x)
limx→F−1(1)(ddx(1−F(x))f(x))=0⇒X(n)→dG(x)
Używając zwykłego zapisu standardowej normy i obliczając pochodną, mamy
ddx(1−Φ(x))ϕ(x)=−ϕ(x)2−ϕ′(x)(1−Φ(x))ϕ(x)2=−ϕ′(x)ϕ(x)(1−Φ(x))ϕ(x)−1
Zauważ, że . Ponadto dla rozkładu normalnego . Musimy więc ocenić limitF-1(−ϕ′(x)ϕ(x)=xF−1(1)=∞
limx→∞(x(1−Φ(x))ϕ(x)−1)
Ale jest stosunkiem Milla i wiemy, że stosunek Milla dla standardowej normy ma tendencję do gdy rośnie. Więc 1/xx(1−Φ(x))ϕ(x)1/xx
limx→∞(x(1−Φ(x))ϕ(x)−1)=x1x−1=0
i wystarczający warunek jest spełniony.
Powiązane serie podano jako
an=1nϕ(bn),bn=Φ−1(1−1/n)
UZUPEŁNIENIE
To jest z ch. 10.5 książki HA David & HN Nagaraja (2003), „Order Statistics” (wydanie 3d) .
ξa=F−1(a) . Również odniesienie do de Haana brzmi „Haan, LD (1976). Przykładowe skrajności: wprowadzenie elementarne. Statistica Neerlandica, 30 (4), 161-172. ” Ale uwaga, ponieważ niektóre notacje mają inną treść w de Haan - na przykład w księdze jest funkcja gęstości prawdopodobieństwa, podczas gdy w de Haan oznacza funkcję księgi (tj. współczynnik Milla). De Haan bada również wystarczająco zróżnicowany warunek.f(t) w ( t )f(t)w(t)
Pytanie dotyczy dwóch rzeczy: (1) jak pokazać, że maksymalna zbieżna w tym sensie, że zbiega (w rozkładzie) dla odpowiednio wybranych sekwencji i , do standardowego rozkładu Gumbela i (2) jak znaleźć takie sekwencje. ( X ( n ) - b n ) / a n ( a n ) ( b n )X( n ) ( X( n )- bn) / an (an) (bn)
Pierwszy jest dobrze znany i udokumentowany w oryginalnych pracach na temat twierdzenia Fishera-Tippetta-Gnedenko (FTG). Drugi wydaje się trudniejszy; to jest problem rozwiązany tutaj.
Pamiętaj, aby wyjaśnić niektóre twierdzenia pojawiające się gdzie indziej w tym wątku
To, co maksymalne, nie zbiega się do niczego: rozbiega się (choć bardzo wolno).
Wydaje się, że istnieją różne konwencje dotyczące dystrybucji Gumbela. Przyjmę konwencję, że CDF odwróconego rozkładu Gumbela jest, w odpowiedniej skali i lokalizacji, podane przez . Odpowiednio ustandaryzowane maksimum iid Normal zmienia się zbieżnie do odwróconego rozkładu Gumbela.1−exp(−exp(x))
Intuicja
Gdy mają tę samą funkcję wspólnej dystrybucji , rozkład maksymalnego wynosiXi F X(n)
Kiedy wsparcie nie ma górnej granicy, jak w przypadku rozkładu normalnego, sekwencja funkcji maszeruje na zawsze w prawo bez ograniczeń:F Fn
częściowe wykresy dla .Fn n=1,2,22,24,28,216
Aby zbadać kształty tych rozkładów, możemy przesunąć każdy z powrotem w lewo o pewną wartość i przeskalować go o aby były porównywalne.bn an
Każdy z poprzednich wykresów został przesunięty, aby ustawić jego medianę na i uczynić przedział długości międzykwartylowej.0
FTG zapewnia, że sekwencje i można wybrać tak, aby te funkcje rozkładu zbiegały się punktowo przy każdym do pewnego ekstremalnego rozkładu wartości , aż do skali i lokalizacji. Gdy jest rozkładem normalnym, szczególnym ograniczającym rozkładem wartości ekstremalnych jest odwrócony Gumbel, aż do położenia i skali.(an) (bn) x F
Rozwiązanie
Kuszące jest naśladowanie centralnego twierdzenia granicznego poprzez standaryzację celu uzyskania średniej jednostki i wariancji jednostki. Jest to jednak częściowo niewłaściwe, ponieważ FTG ma zastosowanie nawet do (ciągłych) dystrybucji, które nie mają pierwszego ani drugiego momentu. Zamiast tego użyj percentyla (takiego jak mediana), aby określić lokalizację, a różnicę percentyli (takich jak IQR), aby określić spread. (To ogólne podejście powinno odszukać i dla dowolnego ciągłego rozkładu.)Fn an bn
W przypadku standardowego rozkładu normalnego okazuje się to łatwe! Niech . Kwantyl odpowiadający jest dowolną wartością dla której . Przywołując definicję , rozwiązaniem jest0<q<1 Fn q xq Fn(xq)=q Fn(x)=Fn(x)
Dlatego możemy ustawić
Ponieważ z założenia mediana wynosi a jej IQR wynosi , mediana wartości granicznej (która jest pewną wersją odwróconego Gumbela) musi wynosić a jej IQR musi wynosić . Niech parametrem skali będzie a parametrem lokalizacji będzie . Ponieważ mediana to a IQR łatwo można znaleźć na , parametry muszą byćGn 0 1 Gn 0 1 β α α+βloglog(2) β(loglog(4)−loglog(4/3))
Nie jest konieczne, aby i były dokładnie tymi wartościami: muszą jedynie je przybliżać, pod warunkiem, że limit jest nadal odwróconym rozkładem . Prosta (ale uciążliwa) analiza dla standardowej normalnej wskazuje, że przybliżeniaan bn Gn F
będzie działać dobrze (i są tak proste, jak to możliwe).
Jasnoniebieskie krzywe są częściowymi wykresami dla przy użyciu przybliżonych sekwencji i . Ciemnoczerwona linia przedstawia odwrócony rozkład Gumbela z parametrami i . Konwergencja jest wyraźna (chociaż szybkość konwergencji dla ujemnego jest zauważalnie wolniejsza).Gn n=2,26,211,216 a′n b′n α β x
Bibliografia
BV Gnedenko, O ograniczeniu rozkładu maksymalnego terminu w losowej serii . W Kotz and Johnson, Breakthroughs in Statistics Tom I: Foundations and Basic Theory, Springer, 1992. Tłumaczone przez Normana Johnsona.
źródło