Niech patyk o długości 1 zostanie podzielony losowo na fragmenty równomiernie. Jaki jest rozkład długości najdłuższego fragmentu?
Bardziej formalnie, niech będzie IID , i niech będą powiązanymi statystykami zamówień, tzn. Po prostu zamawiamy próbka w taki sposób, że . Niech .
Interesuje mnie dystrybucja . są również momenty, wyniki asymptotyczne lub przybliżenia dla k \ uparrow \ infty .
Odpowiedzi:
Dzięki informacjom podanym przez @Glen_b mogłem znaleźć odpowiedź. Używając tych samych notacji co pytanie
gdzie jeśli i przeciwnym razie. Podaję również oczekiwanie i asymptotyczną zbieżność do rozkładu Gumbela ( NB : nie Beta)a > 0 0za+= a a > 0 0
Materiał dowodów pochodzi z kilku publikacji połączonych w odnośnikach. Są nieco długie, ale proste.
1. Dowód dokładnego podziału
Niech będą jednolitymi losowymi zmiennymi IID w przedziale . Zamawiając je, otrzymujemy oznaczonych statystyk zamówienia . Jednolite odstępy są zdefiniowane jako , przy czym i . Uporządkowane odstępy to odpowiednie uporządkowane statystyki . Zmienna zainteresowania to .( 0 , 1 ) k ( U ( 1 ) , ... , u ( k ) ) Δ I = U ( i ) - u ( i - 1 ) u ( 0 ) = 0 U ( k + 1 ) = 1 Δ ( 1 ) ≤( U1, … , Uk) (0,1) k (U(1),…,U(k)) Δi=U(i)−U(i−1) U(0)=0 U(k+1)=1 Δ ( k + 1 )Δ(1)≤…≤Δ(k+1) Δ(k+1)
Dla stałych definiujemy zmienną wskaźnikową . Przez symetrię losowy wektor jest wymienny, więc łączny rozkład podzbioru rozmiaru jest taki sam jak łączny rozkład pierwszy . W ten sposób uzyskujemy rozszerzenie produktu1 i = 1 { Δ i > x } ( 1 1 , … , 1 k + 1 ) j jx∈(0,1) 1i=1{Δi>x} (11,…,1k+1) j j
Udowodnimy teraz, że , co określi rozkład podany powyżej. Udowadniamy to dla , ponieważ ogólny przypadek udowodniono podobnie. j = 2E(∏ji=11i)=(1−jx)k+ j=2
Jeśli , punktów przerwania znajduje się w przedziale . Warunkowo w przypadku tego zdarzenia punkty przerwania są nadal wymienne, więc prawdopodobieństwo, że odległość między drugim a pierwszym punktem przerwania jest większa niż jest takie samo, jak prawdopodobieństwo, że odległość między pierwszym punktem przerwania a lewą barierą (w pozycji ) jest większy niż . Więck ( x , 1 ) x x xΔ1>x k (x,1) x x x
2. Oczekiwanie
Dla dystrybucji ze skończonym wsparciem mamy
Łącząc dystrybucję otrzymujemyΔ(k+1)
Ostatnia równość to klasyczna reprezentacja liczb harmonicznych , które pokazujemy poniżej.Hi=1+12+…+1i
Wraz ze zmianą zmiennej i rozszerzeniem produktu otrzymujemyu=1−x
3. Alternatywna konstrukcja równomiernych odstępów
Aby uzyskać asymptotyczny rozkład największego fragmentu, będziemy musieli wykazać klasyczną konstrukcję równomiernych odstępów jako zmiennych wykładniczych podzielonych przez ich sumę. Gęstość prawdopodobieństwa powiązanych statystyk zamówień wynosi(U(1),…,U(k))
Jeśli oznaczymy jednolite odstępy , przy , otrzymamyΔi=U(i)−U(i−1) U(0)=0
Definiując , otrzymujemy w ten sposóbU(k+1)=1
Teraz niech będzie wykładniczymi zmiennymi losowymi IID ze średnią 1, i niech . Po prostej zmianie zmiennej możemy to zobaczyć(X1,…,Xk+1) S=X1+…+Xk+1
Zdefiniuj , tak że poprzez zmianę zmiennej otrzymujemyYi=Xi/S
Łącząc tę gęstość względem , otrzymujemy w ten sposóbs
Zatem łączny rozkład równomiernych odstępów w przedziale jest taki sam, jak wspólny rozkład losowych zmiennych podzielonych przez ich sumę. Dochodzimy do następującej równoważności dystrybucjik + 1 (0,1) k+1
4. Dystrybucja asymptotyczna
Korzystając z powyższej równoważności, otrzymujemy
gdzie . Ta zmienna znika z prawdopodobieństwem, ponieważ i . Asymptotycznie rozkład jest taki sam jak w przypadku . Ponieważ to IID, mamyTk+1=X1+…+Xk+1k+1−1 E(Tk+1)=0 Var(log(k+1)Tk+1)=(log( k + 1 ) )2)k + 1↓ 0 X( k + 1 )- log( k + 1 ) Xja
5. Przegląd graficzny
Poniższy wykres pokazuje rozkład największego fragmentu dla różnych wartości . Dla nałożyłem również asymptotyczny rozkład Gumbela (cienka linia). Gumbel jest bardzo złym przybliżeniem małych wartości więc pomijam je, aby nie przeciążały obrazu. Przybliżenie Gumbela jest dobre od .k k = 10 , 20 , 50 k k ≈ 50
6. Referencje
Powyższe dowody pochodzą z odniesień 2 i 3. Cytowana literatura zawiera wiele innych wyników, takich jak rozkład uporządkowanych odstępów dowolnej rangi, ich rozkład graniczny i niektóre alternatywne konstrukcje uporządkowanych jednolitych odstępów. Najważniejsze odniesienia nie są łatwo dostępne, dlatego udostępniam również linki do pełnego tekstu.
źródło
To nie jest pełna odpowiedź, ale wykonałem kilka szybkich symulacji i oto, co otrzymałem:
Wygląda to w znacznym stopniu na wersję beta i ma to trochę sensu, ponieważ statystyki porządkowe dla dystrybucji jednolitych iid są w wersji beta wiki .
Może to stanowić punkt wyjścia do uzyskania wynikowego pliku pdf.
Dokonam aktualizacji, jeśli dojdę do ostatecznego zamkniętego rozwiązania.
Twoje zdrowie!
źródło
Odpowiedziałem na konferencję w Sienie (Włochy) w 2005 r. Artykuł (2006) jest prezentowany na mojej stronie tutaj (pdf) . Dokładne rozkłady wszystkich odstępów (od najmniejszych do największych) znajdują się na stronach 75 i 76.
Mam nadzieję przedstawić prezentację na ten temat na konferencji RSS w Manchesterze (Anglia) we wrześniu 2016 r.
źródło