Łamigłówka: Jaka jest oczekiwana długość sekwencji iid, która monotonicznie wzrasta, gdy jest pobierana z jednolitego rozkładu [0,1]?

28

To pytanie do wywiadu dotyczące stanowiska analityka ilościowego, przedstawione tutaj . Załóżmy, że rysujemy z jednolitego rozkładu a losowania są takie same, jaka jest oczekiwana długość monotonicznie rosnącego rozkładu? Oznacza to, że przestajemy rysować, jeśli bieżące losowanie jest mniejsze lub równe poprzedniemu losowaniu.[0,1]

Mam kilka pierwszych: \ Pr (\ text {długość} = 2) = \ int_0 ^ 1 \ int_ {x_1} ^ 1 \ int_0 ^ {x_2} \ mathrm {d} x_3 \, \ mathrm {d} x_2 \, \ mathrm {d} x_1 = 1/3 \ Pr (\ text {length} = 3) = \ int_0 ^ 1 \ int_ {x_1} ^ 1 \ int_ {x_2} ^ 1 \ int_0 ^ {x_3} \ mathrm {d} x_4 \, \ mathrm { d} x_3 \, \ mathrm {d} x_2 \, \ mathrm {d} x_1 = 1/8

Pr(length=1)=010x1dx2dx1=1/2
Pr(length=2)=01x110x2dx3dx2dx1=1/3
Pr(length=3)=01x11x210x3dx4dx3dx2dx1=1/8

ale coraz trudniej jest mi wyliczyć te zagnieżdżone całki i nie dostaję „sztuczki” do uogólnienia na Pr(length=n) . Wiem, że ostateczna odpowiedź jest ułożona

E(length)=n=1nPr(length=n)

Jakieś pomysły na odpowiedź na to pytanie?

Amazonka
źródło

Odpowiedzi:

37

Oto kilka ogólnych wskazówek na temat rozwiązania tego pytania:

Masz ciąg ciągłych zmiennych losowych IID, co oznacza, że ​​są one wymienne . Co to oznacza prawdopodobieństwo otrzymania określonego zamówienia dla pierwszych n wartości? Na tej podstawie, jakie jest prawdopodobieństwo uzyskania rosnącego porządku dla pierwszych n wartości? Można to rozwiązać bez integracji w rozkładzie podstawowych zmiennych losowych. Jeśli zrobisz to dobrze, będziesz w stanie uzyskać odpowiedź bez jakiegokolwiek założenia o jednolitym rozkładzie - tzn. Otrzymasz odpowiedź, która dotyczy dowolnych wymienialnych sekwencji ciągłych zmiennych losowych.


Oto pełne rozwiązanie ( nie patrz, czy sam to wymyślisz ):

Niech będzie sekwencją niezależnych ciągłych zmiennych losowych i niech to liczba rosnących elementów na początku sekwencji. Ponieważ są to zmienne losowe wymienialne w sposób ciągły, prawie na pewno nie są sobie równe, a każda kolejność jest równie prawdopodobna, więc mamy: (Zauważ, że ten wynik dotyczy dowolnej sekwencji IID ciągłych zmiennych losowych; nie muszą one mieć jednakowego rozkładu). Zatem zmienna losowa ma funkcję masy prawdopodobieństwaU1,U2,U3,IID Continuous DistNmax{nN|U1<U2<<Un}

P(Nn)=P(U1<U2<<Un)=1n!.
N
pN(n)=P(N=n)=1n!1(n+1)!=n(n+1)!.
Zauważysz, że ten wynik jest zgodny z wartościami obliczonymi przez całkowanie względem wartości leżących u podstaw. (Ta część nie jest potrzebna do rozwiązania; jest uwzględniona dla kompletności.) Korzystając ze znanej reguły oczekiwanej wartości nieujemnej zmiennej losowej , mamy: Zauważ ponownie, że w naszej pracy nie ma nic, co użyłoby leżącego u podstaw rozkładu równomiernego. Jest to zatem ogólny wynik, który stosuje się do dowolnej wymiennej sekwencji ciągłych zmiennych losowych.
E(N)=n=1P(Nn)=n=11n!=e1=1.718282.

Kilka dalszych spostrzeżeń:

Z powyższego działania wynika, że ​​ten wynik podziału i wynikająca z niego oczekiwana wartość nie zależą od rozkładu leżącego u podstaw, o ile jest to rozkład ciągły. To naprawdę nie jest zaskakujące, gdy weźmiemy pod uwagę fakt, że każdą ciągłą skalarną zmienną losową można uzyskać poprzez monotoniczną transformację jednolitej zmiennej losowej (przy czym transformacja jest funkcją kwantylową). Ponieważ transformacje monotoniczne zachowują porządek rang, analizowanie prawdopodobieństwa uporządkowania dowolnych ciągłych zmiennych losowych IID jest tym samym, co analizowanie prawdopodobieństwa uporządkowania zmiennych losowych jednorodnych IID .

Przywróć Monikę
źródło
6
Ładnie wykonane! (+1)
łucznik
1
@ Ben Idę za tobą do ostatniego równania ... Myślałem, że oczekiwana wartość powinna wynosić, zamiast ... czy możesz wyjaśnić tę część bardziej?
E(N)=n=1P(N=n)n=n=1n2/(n+1)!
E(N)=n=1P(Nn)
Amazonian
5
Jest to dobrze znana reguła dotycząca oczekiwanej wartości nieujemnej zmiennej losowej . Korzystając z techniki polegającej na zamianie kolejności sumowań, masz: Powinieneś więc znaleźć, że .
E(N)=n=1nP(N=n)=n=1k=1nP(N=n)=n=1k=nP(N=k)=n=1P(Nn).
n1n!=nn2(n+1)!
Przywróć Monikę
Czy możesz dlaczego ? P(Nn)=P(U1<U2<<Un)
badmax
1
@badmax: Zmienna losowa jest liczbą rosnących elementów na początku sekwencji (patrz jej definicja). Zatem, jeśli , oznacza to, że na początku sekwencji jest co najmniej elementów rosnących. Oznacza to, że pierwsze elementów musi być w porządku rosnącym, czyli . NUNnnnU1<U2<<Un
Przywróć Monikę
8

Kolejna metoda rozwiązywania problemów, która zapewnia rozwiązanie bardziej ogólnego przypadku.

Załóżmy, że jest oczekiwaną długością sekwencji monotonicznej , tak że . Wartość, którą chcemy obliczyć, to . I wiemy, że . Uwzględnienie kolejnej wartości,F(x){x1,x2,...}xx1x2F(0)F(1)=0

F(x)=0xπ(y)0dy+x1π(y)(1+F(y))dy=x11+F(y)dy

gdzie to gęstość U [0,1]. Więcπ(y)=1

F(x)=(1+F(x))

Rozwiązując warunek brzegowy , otrzymujemy . Stąd .F(1)=0F(x)=e(1x)1F(0)=e1

jf328
źródło
2
To jest bardzo sprytne. Wystarczy przeliterować: twoje obserwacje są takie: 1) jeśli jest długością najdłuższej początkowej sekwencji rosnącej minus jeden, wystarczy określić i ustawić i 2) wynosi zero, jeśli i przeciwnym razie. Ponieważ otrzymujemy , które w jednolitym przypadku można rozwiązać bezpośrednio. LE(L|X0=x)=:F(x)x=0E(L|X0=x,X1=y)y<x1+E(L|X0=y)E(L|X0=x)=E(E(L|X0=x,X1))=RfX(y)E(L|X0=x,X1=y)dy=x1fX(y)(1+E(L|X0=y))dy=x1fX(y)(1+F(y))dyF(x)=fX(x)(1+F(x))
Matthew Towers
2
+1 Naprawdę bardzo sprytny. Ale ponieważ ostateczna odpowiedź nie zależy od dystrybucji (jak omawia druga odpowiedź), to obliczenie również nie powinno zależeć od . Czy jest jakiś sposób, aby to zobaczyć? CC do @m_t_. π(y)
ameba mówi Przywróć Monikę
3
@amoeba Zgadzam się, że nie powinno zależeć od rozkładu , ale inne wartości powinny: ogólne rozwiązanie tego DE toF(0)XFF=Ceπ1
Matthew Towers
1
@MartijnWeterings Myślę, że , a nie 1, np. W mundurze dostajemyC=eeex1
Matthew Towers
1
Tak masz rację. Użyłem jednolitego przypadku, aby wydedukować moje stwierdzenie, ale fałszywie użyłem zamiastce1x1cex1
Sextus Empiricus
0

Inną metodą rozwiązywania jest bezpośrednie obliczenie całki.

Prawdopodobieństwo wygenerowania sekwencji, której rosnąca część ma długość wynosi , gdzie .nfn(0)fn(x)=x1x11x21...xn21xn11dxndxn1...dx2dx1

Musimy obliczyć .fn(0)

Jeśli spróbujesz obliczyć kilka pierwszych , być może okaże się, żefn(x)fn(x)=t=0n(x)tt!(nt)!

Przypadek podstawowy: gdy ,n=1f1(x)=t=01(x)tt!(nt)!=1x=x1dx1

Hipoteza indukcyjna: gdy ,n=kfn(x)=t=0k(x)tt!(kt)! , for k1

Krok indukcyjny: gdy ,n=k+1

     fn(x)=fk+1(x)=x1fk(x)dx

=x1t=0k(x)tt!(kt)!dx

=t=0k(x)t+1t!(kt)!×(t+1)|x1=t=0k(x)t+1(t+1)!(kt)!|x1

=t=1k+1(x)tt!(kt+1)!|x1

=t=1k+1(1)t+1t!(kt+1)!+t=1k+1(x)tt!(kt+1)!

=t=1k+1(1)t+1Ctk+1(k+1)!+t=1k+1(x)tt!(kt+1)!

=1(k+1)!+t=0k+1(1)t+1Ctk+1(k+1)!+t=1k+1(x)tt!(kt+1)!

=1(k+1)!(11)k+1(k+1)!+t=1k+1(x)tt!(kt+1)!

=t=0k+1(x)tt!(kt+1)!

Według indukcji matematycznej założenie to obowiązuje.

Tak więc otrzymujemy tofn(0)=1n!

ZatemE(length)=n=1Pr(lengthn)=n=11n!=e1

劉家維
źródło