Kolejność statystyk (np. Minimum) nieskończonej kolekcji zmiennych chi-kwadrat?

11

To jest mój pierwszy raz tutaj, więc proszę dać mi znać, czy mogę wyjaśnić moje pytanie w jakikolwiek sposób (w tym formatowanie, tagi itp.). (Mam nadzieję, że mogę później edytować!) Próbowałem znaleźć referencje i próbowałem rozwiązać siebie za pomocą indukcji, ale nie udało mi się obu.

Próbuję uprościć dystrybucję, która wydaje się zmniejszać do statystyki rzędu przeliczalnie nieskończony zbiór niezależnych zmiennych losowych o różnych stopniach swobody; a konkretnie, jaki jest rozkład tej najmniejszej wartości między niezależnymi ?χ2mχ22,χ42,χ62,χ82,

Byłbym zainteresowany przypadkiem szczególnym : jaki jest rozkład minimum (niezależnego) ?m=1χ22,χ42,χ62,

W przypadku minimum udało mi się napisać funkcję dystrybucji skumulowanej (CDF) jako nieskończony produkt, ale nie mogę jej dalej uprościć. Wykorzystałem fakt, że CDF z to (Przy potwierdza to drugi komentarz poniżej dotyczący równoważności z rozkładem wykładniczym z oczekiwaniem 2.) CDF minimum można następnie zapisać jako Pierwszy termin w produkcie to po prostu , a „ostatni” termin toχ2m2m = 1 F m i n ( x ) = 1 - ( 1 - F 2 ( x ) ) ( 1 - F 4 ( x ) ) = 1 - m = 1 ( 1 - F 2 m ( x ) ) = 1 - m =

F2m(x)=γ(m,x/2)/Γ(m)=γ(m,x/2)/(m1)!=1ex/2k=0m1xk/(2kk!).
m=1
Fmin(x)=1(1F2(x))(1F4(x))=1m=1(1F2m(x))
e-x/2e-x/2 k = 0 xk/(2kk!)=1
=1m=1(ex/2k=0m1xk2kk!).
ex/2ex/2k=0xk/(2kk!)=1 . Ale nie wiem, jak (jeśli to możliwe?) Uprościć to stamtąd. A może lepsze jest zupełnie inne podejście.

Kolejne potencjalnie pomocne przypomnienie: jest taki sam jak rozkład wykładniczy z oczekiwaniem 2, a jest sumą dwóch takich wykładników itp. χ 2 4χ22χ42

Jeśli ktoś jest ciekawy, staram się uprościć Twierdzenie 1 w tym przypadku w przypadku regresji na stałej ( dla wszystkich ). (Mam zamiast Rozkłady ponieważ pomnożyłem przez .)i χ 2 Γ 2 κxi=1iχ2Γ2κ

David M. Kaplan
źródło
Czy to odpowiada na twoje pytanie?
mpiktas,
@mpiktas: dzięki za sugestię. Jest podobnie, z tym wyjątkiem, że zamiast wykładniczych o różnych parametrach szybkości, mam kwadraty chi o różnych stopniach swobody (i nieskończoną liczbę, nie skończoną). I podczas gdy jest wykładnikiem, nie; są to sumy wykładnicze, ale same sumy wykładnicze same w sobie nie są wykładnicze. (I idealnie, mam nadzieję na ogólną statystykę zamówień, chociaż min byłoby świetnym początkiem.)χ22χ42,χ62,
David M Kaplan,
1
Xkλ/2k=1,2,1Fmin(λ)Xkk
1
T1,T2,Exp(1/2)N(t):=sup{n:i=1nTit}1/2U1=T1U2=T2+T3U3=T4+T5+T6Uiχ2i2są niezależne i dzięki stacjonarnej właściwości niezależnego przyrostu procesu Poissona mamy . P(Uit)=P(N(t)i)
kardynał
@ Cardinal Oczywiście: to dobry sposób, aby to zobaczyć. Ciekawość nie leży w związku między Poissons i Gammas; leży w opisie samego wydarzenia!
whuber

Odpowiedzi:

8

Zera nieskończonego produktu będą sumą zer warunków. Obliczanie do 20 kadencji pokazuje ogólny wzorzec:

wykres złożonych zer

Ten wykres zer w płaszczyźnie zespolonej rozróżnia udział poszczególnych terminów w produkcie za pomocą różnych symboli: na każdym kroku pozorne krzywe są przedłużane dalej, a nowa krzywa rozpoczyna się jeszcze bardziej w lewo.

Złożoność tego obrazu pokazuje, że nie istnieje żadne rozwiązanie w formie zamkniętej w zakresie dobrze znanych funkcji wyższej analizy (takich jak gamma, thetas, funkcje hipergeometryczne itp., A także funkcji elementarnych, jak zbadano w klasycznym tekście takim jak Whittaker I Watson ).

Zatem problem może być bardziej owocnie postawiony nieco inaczej : co musisz wiedzieć o rozkładach statystyk zamówień? Oszacowania ich charakterystycznych funkcji? Niskie momenty zamówienia? Zbliżenia do kwantyli? Coś innego?

Whuber
źródło
Dlaczego zera produktu są ważne? Czuję, że brakuje mi czegoś trywialnego.
mpiktas,
2
@mp Zera i bieguny pokazują coś o złożoności funkcji. Funkcje wymierne mają ich skończoną liczbę. Funkcje elementarne zwykle mają linię zer, na przykład w , całka, dla ; typowe funkcje „transcendentalne” mają nieco bardziej złożone wzory zer, takie jak na wszystkich liczbach całkowitych nie dodatnich (odwrotność funkcji Gamma) lub na siatce punktów (funkcje theta i funkcje eliptyczne). Przedstawiony tutaj skomplikowany wzór sugeruje, że wyrażenie CDF będzie trudne lub niemożliwe, jeśli chodzi o te znane funkcje. 2iπnnexp()
whuber
2
@whuber (1/2), dzięki! Nie wiedziałem o różnych klasach funkcji mających te różne wzory zer w płaszczyźnie złożonej; brzmi to bardzo przydatne, a twój wykres wydaje się odpowiadać na moje pytanie (jak postawiono).
David M Kaplan,
@ Whuber (2/2) sprawdzało to szczególny przypadek (skomplikowanego) rozkładu estymatora podanego w innym artykule. Wykorzystali istnienie dystrybucji, aby uzasadnić użycie bootstrap; mój doradca zasugerował, żebym starał się przybliżyć rozkład. Wydaje się, że ich dystrybucja może być wyłączona w tym specjalnym przypadku (gdzie wiem, co to powinno być), więc sprawdzę w / mój doradcę po upływie terminu przyznania; ale potencjalnie starałbym się rozwinąć rozwinięcie wyższego rzędu -tej statystyki (podzielonej przez ) jako , w bardziej skomplikowanym ustawieniu. Opublikuje ponownie, jeśli tak; dzięki jeszcze raz! mmm
David M Kaplan,
4

jaki jest rozkład minimum (niezależnego) ?χ22,χ42,χ62,

Przepraszamy za spóźnienie około 6 lat. Chociaż PO prawdopodobnie przeszedł teraz na inne problemy, pytanie pozostaje aktualne i pomyślałem, że mogę zasugerować inne podejście.


Dajemy gdzie gdzie z pdf :(X1,X2,X3,)XiChisquared(vi)vi=2ifi(xi)

wprowadź opis zdjęcia tutaj

Oto wykres odpowiadającego mu pliku formacie pdf , gdy zwiększa się wielkość próbki, dla :i = 1  do  8fi(xi)i=1 to 8

wprowadź opis zdjęcia tutaj

Interesuje nas dystrybucja .min(X1,X2,X3,)

Za każdym razem, gdy dodajemy dodatkowy termin, pdf marginalnego ostatniego dodanego terminu przesuwa się coraz bardziej w prawo, dzięki czemu efekt dodawania coraz większej liczby terminów staje się nie tylko coraz mniej istotny, ale po kilku terminach , staje się prawie nieistotny - na minimum próbki. Oznacza to w efekcie, że tylko bardzo niewielka liczba terminów może mieć znaczenie ... a dodanie dodatkowych terminów (lub obecność nieskończonej liczby terminów) jest w dużej mierze nieistotne dla minimalnego problemu próbki.

Test

Aby to przetestować, obliczyłem pdf na 1 termin, 2 warunki, 3 warunki, 4 warunki, 5 warunków, 6 warunków, 7 warunków, 8 warunków, do 9 warunków i do 10 warunków. Aby to zrobić, użyłem funkcji z mathStatica , instruując ją tutaj, aby obliczyć pdf próbki minimalnej ( statystyki zamówienia ) w próbce o rozmiarze , a gdzie parametr (zamiast tego ) to :1 st j i v imin(X1,X2,X3,)OrderStatNonIdentical1stjivi

wprowadź opis zdjęcia tutaj wprowadź opis zdjęcia tutaj

To staje się nieco skomplikowane, gdy liczba terminów rośnie ... ale pokazałem wynik dla 1 semestru (1. rząd), 2 terminów (drugi rząd), 3 terminów (3. rząd) i 4 terminów powyżej.

Poniższy schemat porównuje pdf przykładowego minimum z 1 terminem (niebieski), 2 terminami (pomarańczowy), 3 terminami i 10 terminami (czerwony). Zwróć uwagę, jak podobne są wyniki przy zaledwie 3 terminach i 10 terminach: wprowadź opis zdjęcia tutaj

Poniższy schemat porównuje 5 terminów (niebieski) i 10 terminów (pomarańczowy) - wykresy są tak podobne, że się wzajemnie zacierają i nawet nie widać różnicy:

wprowadź opis zdjęcia tutaj

Innymi słowy, zwiększenie liczby wyrażeń z 5 do 10 nie ma prawie żadnego widocznego wpływu wizualnego na rozkład minimum próbki.

Przybliżenie półlogistyczne

Wreszcie, doskonałym prostym przybliżeniem pdf próbki min jest rozkład półlogistyczny z pdf:

g(x)=2ex(ex+1)2 for x>0

Poniższy schemat porównuje dokładne rozwiązanie z 10 terminami (które są nie do odróżnienia od 5 lub 20 terminów) i przybliżeniem półlogistycznym (przerywanym):

wprowadź opis zdjęcia tutaj

Zwiększenie do 20 terminów nie robi zauważalnej różnicy.

wilki
źródło