Kolejność statystyk (np. Minimum) nieskończonej kolekcji zmiennych chi-kwadrat?

To jest mój pierwszy raz tutaj, więc proszę dać mi znać, czy mogę wyjaśnić moje pytanie w jakikolwiek sposób (w tym formatowanie, tagi itp.). (Mam nadzieję, że mogę później edytować!) Próbowałem znaleźć referencje i próbowałem rozwiązać siebie za pomocą indukcji, ale nie udało mi się obu.

Próbuję uprościć dystrybucję, która wydaje się zmniejszać do statystyki rzędu przeliczalnie nieskończony zbiór niezależnych zmiennych losowych o różnych stopniach swobody; a konkretnie, jaki jest rozkład tej najmniejszej wartości między niezależnymi ? $\chi^2$ $m$ $\chi^2_2,\chi^2_4,\chi^2_6,\chi^2_8,\ldots$

Byłbym zainteresowany przypadkiem szczególnym : jaki jest rozkład minimum (niezależnego) ? $m=1$ $\chi^2_2,\chi^2_4,\chi^2_6,\ldots$

W przypadku minimum udało mi się napisać funkcję dystrybucji skumulowanej (CDF) jako nieskończony produkt, ale nie mogę jej dalej uprościć. Wykorzystałem fakt, że CDF z to (Przy potwierdza to drugi komentarz poniżej dotyczący równoważności z rozkładem wykładniczym z oczekiwaniem 2.) CDF minimum można następnie zapisać jako Pierwszy termin w produkcie to po prostu , a „ostatni” termin to $\chi^2_{2m}$

F_{2 m} (x) = γ (m, x / 2) / Γ (m) = γ (m, x / 2) / (m - 1)! = 1 - e^{- x / 2} \sum_{k = 0}^{m - 1} x^{k} / (2^{k} k!) .

$F_{2m}(x)=\gamma(m,x/2)/\Gamma(m)=\gamma(m,x/2)/(m-1)!=1-e^{-x/2}\sum_{k=0}^{m-1}x^k/(2^k k!).$

m = 1

$m=1$

F_{m i n} (x) = 1 - (1 - F_{2} (x)) (1 - F_{4} (x)) \dots = 1 - \prod_{m = 1}^{\infty} (1 - F_{2 m} (x))

$F_{min}(x) = 1-(1-F_2(x))(1-F_4(x))\ldots = 1-\prod_{m=1}^\infty (1-F_{2m}(x))$

= 1 - \prod_{m = 1}^{\infty} (e^{- x / 2} \sum_{k = 0}^{m - 1} \frac{x^{k}}{2^{k} k!}) .

$= 1- \prod_{m=1}^\infty \left(e^{-x/2}\sum_{k=0}^{m-1}\frac{x^k}{2^k k!}\right).$

e^{- x / 2}

$e^{-x/2}$

e^{- x / 2} \sum_{k = 0}^{\infty} x^{k} / (2^{k} k!) = 1

$e^{-x/2}\sum_{k=0}^\infty x^k/(2^k k!)=1$ . Ale nie wiem, jak (jeśli to możliwe?) Uprościć to stamtąd. A może lepsze jest zupełnie inne podejście.

Kolejne potencjalnie pomocne przypomnienie: jest taki sam jak rozkład wykładniczy z oczekiwaniem 2, a jest sumą dwóch takich wykładników itp. $\chi^2_2$ $\chi^2_4$

Jeśli ktoś jest ciekawy, staram się uprościć Twierdzenie 1 w tym przypadku w przypadku regresji na stałej ( dla wszystkich ). (Mam zamiast Rozkłady ponieważ pomnożyłem przez .) $x_i=1$ $i$ $\chi^2$ $\Gamma$ $2\kappa$

distributions chi-squared exponential order-statistics minimum David M. Kaplan
źródło

Czy to odpowiada na twoje pytanie?

mpiktas,

@mpiktas: dzięki za sugestię. Jest podobnie, z tym wyjątkiem, że zamiast wykładniczych o różnych parametrach szybkości, mam kwadraty chi o różnych stopniach swobody (i nieskończoną liczbę, nie skończoną). I podczas gdy jest wykładnikiem, nie; są to sumy wykładnicze, ale same sumy wykładnicze same w sobie nie są wykładnicze. (I idealnie, mam nadzieję na ogólną statystykę zamówień, chociaż min byłoby świetnym początkiem.)

χ_{2}^{2}

$\chi^2_2$

χ_{4}^{2}, χ_{6}^{2}, \dots

$\chi^2_4,\chi^2_6,\ldots$

David M Kaplan,

X_{k}

$X_k$

λ / 2

$\lambda/2$

k = 1, 2, \dots

$k=1,2,\ldots$

1 - F_{m i n} (λ)

$1-F_{min}(\lambda)$

X_{k} \leq k

$X_k \le k$

T_{1}, T_{2}, \dots

$T_1, T_2, \ldots$

E x p (1 / 2)

$\mathrm{Exp}(1/2)$

N (t) := sup {n : \sum_{i = 1}^{n} T_{i} \leq t}

$N(t) := \sup\{n: \sum_{i=1}^n T_i \leq t\}$

1 / 2

$1/2$

U_{1} = T_{1}

$U_1 = T_1$

U_{2} = T_{2} + T_{3}

$U_2 = T_2 + T_3$

U_{3} = T_{4} + T_{5} + T_{6}

$U_3 = T_4 + T_5 + T_6$

U_{i} \sim χ_{2 i}^{2}

$U_i\sim\chi_{2i}^2$ są niezależne i dzięki stacjonarnej właściwości niezależnego przyrostu procesu Poissona mamy .

P (U_{i} \geq t) = P (N (t) \leq i)

$\mathbb{P}(U_i \geq t) = \mathbb{P}( N(t) \leq i)$

kardynał

@ Cardinal Oczywiście: to dobry sposób, aby to zobaczyć. Ciekawość nie leży w związku między Poissons i Gammas; leży w opisie samego wydarzenia!

whuber

Odpowiedzi:

Zera nieskończonego produktu będą sumą zer warunków. Obliczanie do 20 kadencji pokazuje ogólny wzorzec:

wykres złożonych zer

Ten wykres zer w płaszczyźnie zespolonej rozróżnia udział poszczególnych terminów w produkcie za pomocą różnych symboli: na każdym kroku pozorne krzywe są przedłużane dalej, a nowa krzywa rozpoczyna się jeszcze bardziej w lewo.

Złożoność tego obrazu pokazuje, że nie istnieje żadne rozwiązanie w formie zamkniętej w zakresie dobrze znanych funkcji wyższej analizy (takich jak gamma, thetas, funkcje hipergeometryczne itp., A także funkcji elementarnych, jak zbadano w klasycznym tekście takim jak Whittaker I Watson ).

Zatem problem może być bardziej owocnie postawiony nieco inaczej : co musisz wiedzieć o rozkładach statystyk zamówień? Oszacowania ich charakterystycznych funkcji? Niskie momenty zamówienia? Zbliżenia do kwantyli? Coś innego?

Whuber
źródło

Dlaczego zera produktu są ważne? Czuję, że brakuje mi czegoś trywialnego.

mpiktas,

@mp Zera i bieguny pokazują coś o złożoności funkcji. Funkcje wymierne mają ich skończoną liczbę. Funkcje elementarne zwykle mają linię zer, na przykład w , całka, dla ; typowe funkcje „transcendentalne” mają nieco bardziej złożone wzory zer, takie jak na wszystkich liczbach całkowitych nie dodatnich (odwrotność funkcji Gamma) lub na siatce punktów (funkcje theta i funkcje eliptyczne). Przedstawiony tutaj skomplikowany wzór sugeruje, że wyrażenie CDF będzie trudne lub niemożliwe, jeśli chodzi o te znane funkcje.

2 i π n

$2i\pi n$

n

$n$

\exp ()

$\exp()$

whuber

@whuber (1/2), dzięki! Nie wiedziałem o różnych klasach funkcji mających te różne wzory zer w płaszczyźnie złożonej; brzmi to bardzo przydatne, a twój wykres wydaje się odpowiadać na moje pytanie (jak postawiono).

David M Kaplan,

@ Whuber (2/2) sprawdzało to szczególny przypadek (skomplikowanego) rozkładu estymatora podanego w innym artykule. Wykorzystali istnienie dystrybucji, aby uzasadnić użycie bootstrap; mój doradca zasugerował, żebym starał się przybliżyć rozkład. Wydaje się, że ich dystrybucja może być wyłączona w tym specjalnym przypadku (gdzie wiem, co to powinno być), więc sprawdzę w / mój doradcę po upływie terminu przyznania; ale potencjalnie starałbym się rozwinąć rozwinięcie wyższego rzędu -tej statystyki (podzielonej przez ) jako , w bardziej skomplikowanym ustawieniu. Opublikuje ponownie, jeśli tak; dzięki jeszcze raz!

m

$m$

m

$m$

m \to \infty

$m\to\infty$

David M Kaplan,

jaki jest rozkład minimum (niezależnego) ? $\chi^2_2,\chi^2_4,\chi^2_6,\ldots$

Przepraszamy za spóźnienie około 6 lat. Chociaż PO prawdopodobnie przeszedł teraz na inne problemy, pytanie pozostaje aktualne i pomyślałem, że mogę zasugerować inne podejście.

Dajemy gdzie gdzie z pdf : $(X_1, X_2, X_3, \dots)$ $X_i \sim \text{Chisquared}(v_i)$ $v_i= 2i$ $f_i(x_i)$

Oto wykres odpowiadającego mu pliku formacie pdf , gdy zwiększa się wielkość próbki, dla : $f_i(x_i)$ $i = 1 \text{ to } 8$

Interesuje nas dystrybucja . $\text{min}(X_1, X_2, X_3, \dots)$

Za każdym razem, gdy dodajemy dodatkowy termin, pdf marginalnego ostatniego dodanego terminu przesuwa się coraz bardziej w prawo, dzięki czemu efekt dodawania coraz większej liczby terminów staje się nie tylko coraz mniej istotny, ale po kilku terminach , staje się prawie nieistotny - na minimum próbki. Oznacza to w efekcie, że tylko bardzo niewielka liczba terminów może mieć znaczenie ... a dodanie dodatkowych terminów (lub obecność nieskończonej liczby terminów) jest w dużej mierze nieistotne dla minimalnego problemu próbki.

Test

Aby to przetestować, obliczyłem pdf na 1 termin, 2 warunki, 3 warunki, 4 warunki, 5 warunków, 6 warunków, 7 warunków, 8 warunków, do 9 warunków i do 10 warunków. Aby to zrobić, użyłem funkcji z mathStatica , instruując ją tutaj, aby obliczyć pdf próbki minimalnej ( statystyki zamówienia ) w próbce o rozmiarze , a gdzie parametr (zamiast tego ) to : $\text{min}(X_1, X_2, X_3, \dots)$ OrderStatNonIdentical $1^{\text{st}}$ $j$ $i$ $v_i$

To staje się nieco skomplikowane, gdy liczba terminów rośnie ... ale pokazałem wynik dla 1 semestru (1. rząd), 2 terminów (drugi rząd), 3 terminów (3. rząd) i 4 terminów powyżej.

Poniższy schemat porównuje pdf przykładowego minimum z 1 terminem (niebieski), 2 terminami (pomarańczowy), 3 terminami i 10 terminami (czerwony). Zwróć uwagę, jak podobne są wyniki przy zaledwie 3 terminach i 10 terminach:

Poniższy schemat porównuje 5 terminów (niebieski) i 10 terminów (pomarańczowy) - wykresy są tak podobne, że się wzajemnie zacierają i nawet nie widać różnicy:

Innymi słowy, zwiększenie liczby wyrażeń z 5 do 10 nie ma prawie żadnego widocznego wpływu wizualnego na rozkład minimum próbki.

Przybliżenie półlogistyczne

Wreszcie, doskonałym prostym przybliżeniem pdf próbki min jest rozkład półlogistyczny z pdf:

g (x) = \frac{2 e^{- x}}{{(e^{- x} + 1)}^{2}} for x > 0

$g(x) = \frac{2 e^{-x}}{\left(e^{-x}+1\right)^2} \quad \text{ for } x>0$

Poniższy schemat porównuje dokładne rozwiązanie z 10 terminami (które są nie do odróżnienia od 5 lub 20 terminów) i przybliżeniem półlogistycznym (przerywanym):

Zwiększenie do 20 terminów nie robi zauważalnej różnicy.

wilki
źródło