Czy są dobrze znane formuły dla statystyk porządkowych niektórych rozkładów losowych? W szczególności doceniono by statystyki pierwszego i ostatniego rzędu normalnej zmiennej losowej, ale bardziej ogólna odpowiedź.
Edycja: Aby to wyjaśnić, szukam formuł aproksymujących, które można mniej lub bardziej wyraźnie ocenić, a nie dokładnego wyrażenia całkowego.
Na przykład widziałem następujące dwa przybliżenia statystyki pierwszego rzędu (tj. Minimum) normalnego rv:
i
Pierwszy z nich, dla , daje w przybliżeniu co wydaje się być bardzo luźno związane.
Drugi daje podczas gdy szybki Monte Carlo daje , więc nie jest to złe przybliżenie, ale też nie jest świetne, a co ważniejsze, nie mam intuicji na temat Skąd to pochodzi.
Jakaś pomoc?
distributions
normal-distribution
approximation
order-statistics
Chris Taylor
źródło
źródło
Odpowiedzi:
Klasycznym odniesieniem jest Royston (1982) [1], w którym algorytmy wykraczają poza jawne formuły. Cytuje również dobrze znaną formułę Blom (1958): przyα=0,375. Ta formuła daje mnożnik -2,73 dlan=200,r=1.E(r:n)≈μ+Φ−1(r−αn−2α+1)σ α=0.375 n=200,r=1
[1]: Algorytm AS 177: oczekiwane normalne statystyki rzędu (dokładne i przybliżone) JP Royston. Journal of the Royal Statistics Society. Seria C (Statystyka stosowana) Vol. 31, nr 2 (1982), s. 161–165
źródło
Istnieją sposoby, aby dokonać tego wyboru, więc mamy:(N1)(N−1i−1)
EDIT w moim oryginalnym poście podjąłem bardzo słabą próbę pójścia dalej od tego punktu, a poniższe komentarze odzwierciedlają to. Próbowałem to naprawić poniżej
Jeśli weźmiemy średnią wartość tego pliku pdf, otrzymujemy:
W tej całce dokonujemy następującej zmiany zmiennej (biorąc pod uwagę wskazówkę @ Henry'ego), a całka staje się:pi=FX(xi)
Jest to więc oczekiwana wartość odwrotnego CDF, którą można dobrze oszacować za pomocą metody delta, aby uzyskać:
Aby dokonać lepszego przybliżenia, możemy rozwinąć do drugiego rzędu (pierwsze zróżnicowanie oznaczające), zwracając uwagę, że druga pochodna odwrotności to:
Niech . Następnie mamy:νi=F−1X[iN+1]
Teraz, specjalizując się w normalnym przypadku, mamy
Zauważ, że Oczekiwanie to w przybliżeniu:fX(νi)=1σϕ[Φ−1(iN+1)]
I w końcu:
Chociaż, jak zauważył @whuber, nie będzie to dokładne w ogonach. W rzeczywistości myślę, że może być gorzej z powodu skośności wersji beta o różnych parametrach
źródło
Odpowiedź Aniko opiera się na znanej formule Bloma, która obejmuje wybór . Okazuje się, że ta formuła sama w sobie jest jedynie przybliżeniem dokładnej odpowiedzi ze względu na G. Elfvinga (1947), Asymptotyczny rozkład zakresu w próbkach z normalnej populacji , Biometrika, tom. 34, s. 111–119. Formuła Elfvinga jest skierowana na minimum i maksimum próbki, dla której prawidłowy wybór alfa wynosi . Formuła Bloma powstaje, gdy przybliżymy o .α=3/8 π/8 π 3
Używając formuły Elfvinga zamiast przybliżenia Bloma, otrzymujemy mnożnik -2,744165. Liczba ta jest bliższa dokładnej odpowiedzi Erika P. (-2,746) i przybliżeniu Monte Carlo (-2,75) niż przybliżeniu Bloma (-2,73), a jednocześnie jest łatwiejsza do wdrożenia niż dokładna formuła.
źródło
W zależności od tego, co chcesz zrobić, ta odpowiedź może, ale nie musi pomóc - otrzymałem następującą dokładną formułę z pakietu statystyk Maple .
Samo w sobie nie jest to bardzo przydatne (i prawdopodobnie można je dość łatwo wyprowadzić ręcznie, ponieważ jest to minimum zmiennych losowych), ale pozwala na szybkie i bardzo dokładne przybliżenie dla danych wartości - znacznie dokładniejsze niż Monte Carlo:n n
daje odpowiednio -2,746042447 i -2,746042447451154492412344.
(Pełne ujawnienie - utrzymuję ten pakiet.)
źródło