Teoria ekstremalnych wartości - pokaż: Normalna do Gumbela

21

Maksymalna wartość iid Standardnormals zbieżny do standardowa Gumbela rozdzielający według wartości ekstremalnej teorii .X1,,Xn.

Jak możemy to pokazać?

Mamy

P(maxXix)=P(X1x,,Xnx)=P(X1x)P(Xnx)=F(x)n

Musimy znaleźć / wybrać an>0,bnR ciągów stałych takich, że:

F(anx+bn)nnG(x)=eexp(x)

Czy możesz to rozwiązać lub znaleźć w literaturze?

Istnieje kilka przykładów str.6 / 71 , ale nie w przypadku Normal:

Φ(anx+bn)n=(12πanx+bney22dy)neexp(x)
emcor
źródło

Odpowiedzi:

23

Pośredni sposób jest następujący:
dla absolutnie ciągłych dystrybucji Richard von Mises (w artykule z 1936 r. „La Distribution de la plus grande de n valeurs” , który wydaje się być odtworzony - w języku angielskim? - w wydaniu z 1964 roku z wybranymi jego dokumenty), zapewnił następujący wystarczający warunek, aby maksimum próbki zbliżyło się do standardowego Gumbela, G(x) :

Niech będzie wspólną funkcją rozkładu iid zmiennych losowych, a ich wspólną gęstością. A następnie, jeślinF(x)nf(x)

limxF1(1)(ddx(1F(x))f(x))=0X(n)dG(x)

Używając zwykłego zapisu standardowej normy i obliczając pochodną, ​​mamy

ddx(1Φ(x))ϕ(x)=ϕ(x)2ϕ(x)(1Φ(x))ϕ(x)2=ϕ(x)ϕ(x)(1Φ(x))ϕ(x)1

Zauważ, że . Ponadto dla rozkładu normalnego . Musimy więc ocenić limitF-1(ϕ(x)ϕ(x)=xF1(1)=

limx(x(1Φ(x))ϕ(x)1)

Ale jest stosunkiem Milla i wiemy, że stosunek Milla dla standardowej normy ma tendencję do gdy rośnie. Więc 1/xx(1Φ(x))ϕ(x)1/xx

limx(x(1Φ(x))ϕ(x)1)=x1x1=0

i wystarczający warunek jest spełniony.

Powiązane serie podano jako

an=1nϕ(bn),bn=Φ1(11/n)

UZUPEŁNIENIE

To jest z ch. 10.5 książki HA David & HN Nagaraja (2003), „Order Statistics” (wydanie 3d) .

ξa=F1(a) . Również odniesienie do de Haana brzmi „Haan, LD (1976). Przykładowe skrajności: wprowadzenie elementarne. Statistica Neerlandica, 30 (4), 161-172. ” Ale uwaga, ponieważ niektóre notacje mają inną treść w de Haan - na przykład w księdze jest funkcja gęstości prawdopodobieństwa, podczas gdy w de Haan oznacza funkcję księgi (tj. współczynnik Milla). De Haan bada również wystarczająco zróżnicowany warunek.f(t) w ( t )f(t)w(t)

wprowadź opis zdjęcia tutaj

Alecos Papadopoulos
źródło
Nie jestem pewien, czy zrozumiałem twoje rozwiązanie. Więc wziąłeś za standardowy normalny CDF. Prześledziłem i zgadzam się, że wystarczający warunek jest spełniony. Ale w jaki sposób nagle przypisuje się im serię i ? a n b nFanbn
renrenthehamster
@renrenthehamster Myślę, że te dwie części są niezależnie określone (brak bezpośredniego połączenia).
emcor
Jak więc uzyskać powiązaną serię? W każdym razie otworzyłem pytanie na ten temat (i bardziej ogólnie, dla innych dystrybucji poza standardową normą)
renrenthehamster
@renrenthehamster Dodałem odpowiedni materiał. Nie wierzę, że istnieje standardowy przepis na wszystkie przypadki, aby znaleźć te serie.
Alecos Papadopoulos
14

Pytanie dotyczy dwóch rzeczy: (1) jak pokazać, że maksymalna zbieżna w tym sensie, że zbiega (w rozkładzie) dla odpowiednio wybranych sekwencji i , do standardowego rozkładu Gumbela i (2) jak znaleźć takie sekwencje. ( X ( n ) - b n ) / a n ( a n ) ( b n )X(n)(X(n)-bn)/zan(an)(bn)

Pierwszy jest dobrze znany i udokumentowany w oryginalnych pracach na temat twierdzenia Fishera-Tippetta-Gnedenko (FTG). Drugi wydaje się trudniejszy; to jest problem rozwiązany tutaj.

Pamiętaj, aby wyjaśnić niektóre twierdzenia pojawiające się gdzie indziej w tym wątku

  1. To, co maksymalne, nie zbiega się do niczego: rozbiega się (choć bardzo wolno).

  2. Wydaje się, że istnieją różne konwencje dotyczące dystrybucji Gumbela. Przyjmę konwencję, że CDF odwróconego rozkładu Gumbela jest, w odpowiedniej skali i lokalizacji, podane przez . Odpowiednio ustandaryzowane maksimum iid Normal zmienia się zbieżnie do odwróconego rozkładu Gumbela.1exp(exp(x))


Intuicja

Gdy mają tę samą funkcję wspólnej dystrybucji , rozkład maksymalnego wynosiXiFX(n)

Fn(x)=Pr(X(n)x)=Pr(X1x)Pr(X2x)Pr(Xnx)=Fn(x).

Kiedy wsparcie nie ma górnej granicy, jak w przypadku rozkładu normalnego, sekwencja funkcji maszeruje na zawsze w prawo bez ograniczeń:FFn

Rycina 1

częściowe wykresy dla .Fnn=1,2,22,24,28,216

Aby zbadać kształty tych rozkładów, możemy przesunąć każdy z powrotem w lewo o pewną wartość i przeskalować go o aby były porównywalne.bnan

Rysunek 2

Każdy z poprzednich wykresów został przesunięty, aby ustawić jego medianę na i uczynić przedział długości międzykwartylowej.0

FTG zapewnia, że ​​sekwencje i można wybrać tak, aby te funkcje rozkładu zbiegały się punktowo przy każdym do pewnego ekstremalnego rozkładu wartości , aż do skali i lokalizacji. Gdy jest rozkładem normalnym, szczególnym ograniczającym rozkładem wartości ekstremalnych jest odwrócony Gumbel, aż do położenia i skali.(an)(bn)xF


Rozwiązanie

Kuszące jest naśladowanie centralnego twierdzenia granicznego poprzez standaryzację celu uzyskania średniej jednostki i wariancji jednostki. Jest to jednak częściowo niewłaściwe, ponieważ FTG ma zastosowanie nawet do (ciągłych) dystrybucji, które nie mają pierwszego ani drugiego momentu. Zamiast tego użyj percentyla (takiego jak mediana), aby określić lokalizację, a różnicę percentyli (takich jak IQR), aby określić spread. (To ogólne podejście powinno odszukać i dla dowolnego ciągłego rozkładu.)Fnanbn

W przypadku standardowego rozkładu normalnego okazuje się to łatwe! Niech . Kwantyl odpowiadający jest dowolną wartością dla której . Przywołując definicję , rozwiązaniem jest0<q<1FnqxqFn(xq)=qFn(x)=Fn(x)

xq;n=F1(q1/n).

Dlatego możemy ustawić

bn=x1/2;n, an=x3/4;nx1/4;n; Gn(x)=Fn(anx+bn).

Ponieważ z założenia mediana wynosi a jej IQR wynosi , mediana wartości granicznej (która jest pewną wersją odwróconego Gumbela) musi wynosić a jej IQR musi wynosić . Niech parametrem skali będzie a parametrem lokalizacji będzie . Ponieważ mediana to a IQR łatwo można znaleźć na , parametry muszą byćGn01Gn01βαα+βloglog(2)β(loglog(4)loglog(4/3))

α=loglog2loglog(4/3)loglog(4); β=1loglog(4)loglog(4/3).

Nie jest konieczne, aby i były dokładnie tymi wartościami: muszą jedynie je przybliżać, pod warunkiem, że limit jest nadal odwróconym rozkładem . Prosta (ale uciążliwa) analiza dla standardowej normalnej wskazuje, że przybliżeniaanbnGnF

an=log((4log2(2))/(log2(43)))22log(n), bn=2log(n)log(log(n))+log(4πlog2(2))22log(n)

będzie działać dobrze (i są tak proste, jak to możliwe).

Rycina 3

Jasnoniebieskie krzywe są częściowymi wykresami dla przy użyciu przybliżonych sekwencji i . Ciemnoczerwona linia przedstawia odwrócony rozkład Gumbela z parametrami i . Konwergencja jest wyraźna (chociaż szybkość konwergencji dla ujemnego jest zauważalnie wolniejsza).Gnn=2,26,211,216anbnαβx


Bibliografia

BV Gnedenko, O ograniczeniu rozkładu maksymalnego terminu w losowej serii . W Kotz and Johnson, Breakthroughs in Statistics Tom I: Foundations and Basic Theory, Springer, 1992. Tłumaczone przez Normana Johnsona.

Whuber
źródło
@Vossler Formuła w poście Alecosa dla zbieżna z jako . Zachowuje się jak dla dużych . an0n(2log(n)log(2π))1/2n
whuber
Tak, to prawda, zdałem sobie z tego sprawę wkrótce po opublikowaniu komentarza, więc natychmiast go usunąłem. Dziękuję Ci!
Vossler,
@Jess Miałem nadzieję, że ta odpowiedź będzie rozumiana jako pokazująca, między innymi, że nie ma czegoś takiego jak formuła „the”: istnieje niezliczona ilość poprawnych formuł dla ianbn.
whuber
@Jess To lepiej, ponieważ wykazanie alternatywnego podejścia było motywacją do napisania tej odpowiedzi. Nie rozumiem twojej insynuacji, że uważałem za „bezużyteczne zapisywanie odpowiedzi”, ponieważ to właśnie zrobiłem tutaj.
whuber
@Jess Nie mogę kontynuować tej rozmowy, ponieważ jest ona całkowicie jednostronna: muszę jeszcze rozpoznać wszystko, co napisałem w żadnej z twoich cech. Rezygnuję, póki jestem w tyle.
whuber