Rysowanie n przedziałów równomiernie losowo, prawdopodobieństwo, że co najmniej jeden przedział pokrywa się ze wszystkimi innymi

17

Narysuj losowo n przedziałów od [0,1] , gdzie każdy punkt końcowy A, B jest wybrany z równomiernego rozkładu między [0,1] .

Jakie jest prawdopodobieństwo, że co najmniej jeden przedział pokrywa się ze wszystkimi pozostałymi?

Wendeta
źródło
Możesz zajrzeć na prawdopodobieństwo, że ostatni sporządzony n jest mniejszy niż minimum wszystkich uprzednio przygotowanego A , a prawdopodobieństwo, że ostatnia B n jest większa niż maksimum wszystkich uprzednio przygotowanego B . To powinno być pomocne. Następnie zwiększ prawdopodobieństwo, aby uwzględnić fakt, że nie potrzebujemy ostatniego , ale żadnego . (Nie mam czasu, żeby się tym zająć, ale wygląda to na zabawny mały problem. Powodzenia!)AnABnB
S. Kolassa - Przywróć Monikę
Może być nieco zaskakujące, że (1) odpowiedź nie zależy od rozkładu (tylko, że jest ciągła) i (2) dla n>1 jest stała!
whuber
1
Jest to, w jaki sposób n th Interval construted: i) opracowuje dwa numery równomiernie losowo z [0,1], ii) niech mniejszy być n a większy B n ? AnBn
ekvall

Odpowiedzi:

5

Ten post odpowiada na pytanie i przedstawia częściowy postęp w kierunku udowodnienia, że ​​jest poprawny.


Dla n=1 odpowiedź brzmi trywialnie 1 . Dla wszystkich większych n jest (niespodziewanie) zawsze 2/3 .

Aby zobaczyć, dlaczego, najpierw zauważ, że pytanie można uogólnić na dowolny ciągły rozkład (zamiast rozkładu równomiernego). Proces, w którym n przedziały są generowane ilości do rysunku 2 N IID zmiennymi X 1 , X 2 , ... , X 2 n z F i formowania przerwachFn2nX1,X2,,X2nF

[min(X1,X2),max(X1,X2)],,[min(X2n1,X2n),max(X2n1,X2n)].

Ponieważ wszystkie w X i są niezależne są wymienne. Oznacza to, że rozwiązanie byłoby takie samo, gdybyśmy losowo dokonali permutacji wszystkich z nich. Uwarunkujmy zatem statystyki zamówień otrzymane przez posortowanie X i :2nXiXi

X(1)<X(2)<<X(2n)

(gdzie, ponieważ jest ciągłe, nie ma szans, że dowolne dwa będą równe). Gdy n przedziały są utworzone wybierając losowo permutacji Ď S ma dwa n i łączenia ich w paryFnσS2n

[min(Xσ(1),Xσ(2)),max(Xσ(1),Xσ(2))],,[min(Xσ(2n1),Xσ(2n)),max(Xσ(2n1),Xσ(2n))].

To, czy którekolwiek z nich zachodzą na siebie, czy nie, nie zależy od wartości ,X(i) ponieważ zachodzenie na siebie jest zachowane przez dowolną transformację monotoniczną i istnieją takie transformacje, które wysyłają X ( i ) do i . Zatem bez utraty ogólności możemy przyjąć X ( i ) = i i powstaje pytanie:f:RRX(i)iX(i)=i

Niech zbiór zostanie podzielony na n rozłącznych dubletów. Dowolne dwa z nich, { l 1 , r 1 } i { l 2 , r 2 } (z l i < r i ), nakładają się, gdy r 1 > l 2 i r 2 > l 1{1,2,,2n1,2n}n{l1,r1}{l2,r2}li<rir1>l2r2>l1. Powiedz, że partycja jest „dobra”, gdy co najmniej jeden z jej elementów nakłada się na wszystkie pozostałe (a poza tym jest „zła”). Jaki jest odsetek dobrych partycji w funkcji ?n

Aby to zilustrować, rozważ przypadek . Istnieją trzy partycje,n=2

{{1,2},{3,4}}, {{1,4},{2,3}}, {{1,3},{2,4}},

z których dwa dobre (drugi i trzeci) zostały zabarwione na czerwono. Tak więc, odpowiedź w przypadku to 2 / 3 .n=22/3

Możemy grafować takie partycje , wykreślając punkty { 1 , 2 , ... , 2 n } na numer linii i rysunku odcinki pomiędzy poszczególnymi l i i r I , kompensację lekko rozwiązać nakładania wizualne. Oto wykresy z poprzednich trzech partycji, w tej samej kolejności z tym samym kolorem:{{li,ri},i=1,2,,n}{1,2,,2n}liri

Figure 1

Odtąd, aby łatwo dopasować takie wykresy do tego formatu, obrócę je na boki. Na przykład, oto partycji dla n = 3 , jeszcze raz z dobrymi w kolorze czerwonym:15n=3

Figure 2

Dziesięć są dobre, to odpowiedź dla to 10 / 15 = 2 / 3 .n=310/15=2/3

Pierwsza interesująca sytuacja ma miejsce, gdy . Teraz, po raz pierwszy, możliwe jest połączenie przedziałów od 1 do 2 n bez żadnego z nich przecinającego się z innymi. Przykładem jest { { 1 , 3 } , { 2 , 5 } , { 4 , 7 } , { 6 , 8 } } . Połączenie segmentów linii przebiega nieprzerwanie od 1 do 8n=412n{{1,3},{2,5},{4,7},{6,8}}18 but this is not a good partition. Nevertheless, 70 of the 105 partitions are good and the proportion remains 2/3.


The number of partitions increases rapidly with n: it equals 1352n1=(2n)!/(2nn!). Exhaustive enumeration of all possibilities through n=7 continues to yield 2/3 as the answer. Monte-Carlo simulations through n=100 (using 10000 iterations in each) show no significant deviations from 2/3.

I am convinced there is a clever, simple way to demonstrate there is always a 2:1 ratio of good to bad partitions, but I have not found one. A proof is available through careful integration (using the original uniform distribution of the Xi), but it is rather involved and unenlightening.

whuber
źródło
Very cool. I have a hard time following what it means to "condition on the order statistics", would it be possible to add a line of intuition? Seems like a useful technique. I understand up to that the Xi are exchangeable, indeed even iid, that that this allows us to consider any permutation.
ekvall
1
@Student To "condition on" means to say, let's temporarily hold these values fixed and consider what we can learn from that. Later, we will let those values vary (according to their probability distribution). In this case, once we find that the answer is 2/3 regardless of the fixed values of the order statistics, then we no longer have to carry out the second step of varying the order statistics. Mathematically, the order stats are a vector-valued variable X and the indicator of being good is Y, so
E(Y)=E(E(Y|X))=E(2/3)=2/3.
whuber