Proszę wyjaśnić paradoks oczekiwania

75

Kilka lat temu zaprojektowałem detektor promieniowania, który działa na podstawie pomiaru odstępu między zdarzeniami, a nie ich liczenia. Moje założenie było takie, że mierząc niesąsiadujące próbki, średnio mierzyłbym połowę rzeczywistego przedziału. Jednak kiedy testowałem obwód ze skalibrowanym źródłem, odczyt był dwa razy za wysoki, co oznaczało, że mierzyłem pełny interwał.

W starej książce na temat prawdopodobieństwa i statystyki znalazłem rozdział o czymś, co nazywa się „Paradoks oczekiwania”. Przedstawił przykład, w którym autobus przyjeżdża na przystanek co 15 minut, a pasażer przyjeżdża losowo, stwierdził, że pasażer średnio czeka pełne 15 minut. Nigdy nie byłem w stanie zrozumieć matematyki przedstawionej na tym przykładzie i nadal szukam wyjaśnienia. Jeśli ktoś może wyjaśnić, dlaczego tak jest, aby pasażer czekał na pełną przerwę, będę spał lepiej.

poisson-process paradox Stephen Sackett
źródło

1

Jaki jest tytuł i kto jest autorem książki? Czy możesz skopiować tutaj przykładowe słowo po słowie?

Joel Reyes Noche

To nie jest moja specjalność, ale czy paradoks wspomniany przez PO jest taki sam jak paradoks kontroli ?

Joel Reyes Noche

1

Powiązany post: math.stackexchange.com/questions/222674/…

ddiez,

1

Wydaje mi się, że powyższe przypuszczenie ma pewne poparcie. Komentarz do tej odpowiedzi wspomina o paradoksie kontroli.

Joel Reyes Noche

2

Myślę, że korzystanie z autobusu jako analogii jest mylące, ponieważ autobusy zwykle podążają za rozkładem jazdy. Zamiast tego zastanów się, ile czasu zajmie przejazd pustą taksówką, gdy średnio co 15 minut.

Harvey Motulsky

48

Jak zauważył Glen_b, jeśli autobusy przyjeżdżają co minut bez jakiejkolwiek niepewności , wiemy, że maksymalny możliwy czas oczekiwania wynosi minut. Jeśli z naszej strony dotrzemy „losowo”, czujemy, że „średnio” będziemy czekać połowę maksymalnego możliwego czasu oczekiwania . Maksymalny możliwy czas oczekiwania jest tutaj równy maksymalnej możliwej długości między dwoma kolejnymi przylotami. Wskaż nasz czas oczekiwania i maksymalną długość między dwoma kolejnymi przyjazdami autobusów , i twierdzimy, że $15$ $15$ $W$ $R$

\begin{matrix} (1) & E (W) = \frac{1}{2} R = \frac{15}{2} = 7.5 \end{matrix}

$E(W) = \frac 12 R = \frac {15}{2} = 7.5 \tag{1}$

i mamy rację.

Ale nagle zostaje nam odebrana pewność i mówi się nam, że minut to obecnie średnia długość między dwoma przyjazdami autobusów. I wpadamy w „pułapkę myślenia intuicyjnego” i myślimy: „wystarczy tylko zastąpić jego oczekiwaną wartością” i argumentujemy $15$ $R$

\begin{matrix} (2) & E (W) = \frac{1}{2} E (R) = \frac{15}{2} = 7.5 WRONG \end{matrix}

$E(W) = \frac 12 E(R) = \frac {15}{2} = 7.5\;\;\; \text{WRONG} \tag{2}$

Pierwszą wskazówką, że się mylimy, jest to, że nie jest „długością między dwoma kolejnymi przyjazdami autobusu”, jest „ maksymalną długością itp.”. W każdym razie mamy . $R$ $E(R) \neq 15$

Jak doszliśmy do równania ? Pomyśleliśmy: „czas oczekiwania może wynosić maksymalnie od do Przyjeżdżam z takim samym prawdopodobieństwem w każdym przypadku, więc„ wybieram ”losowo i z jednakowym prawdopodobieństwem wszystkie możliwe czasy oczekiwania. Stąd połowa maksymalnej długości między dwoma kolejnymi przyjazdami autobusów jest moja średni czas oczekiwania ”. I mamy rację. $(1)$ $0$ $15$

Ale przez błędne wstawienie wartości do równania nie odzwierciedla ona już naszego zachowania. Z zamiast , równanie mówi: „Wybieram losowo iz jednakowym prawdopodobieństwem wszystkie możliwe czasy oczekiwania, które są mniejsze lub równe średniej długości między dwoma kolejnymi przyjazdami autobusów ” - i tutaj jest nasza intuicyjna pomyłka leży, ponieważ nasze zachowanie się nie zmieniło - tak więc, przybywając losowo równomiernie, w rzeczywistości nadal „losowo i z jednakowym prawdopodobieństwem” wybieramy wszystkie możliwe czasy oczekiwania - ale „wszystkie możliwe czasy oczekiwania” nie są rejestrowane przez $15$ $(2)$ $15$ $E(R)$ $(2)$ - zapomnieliśmy o prawidłowym ogonie rozkładu długości między dwoma kolejnymi przyjazdami autobusów. $15$

Może więc powinniśmy obliczyć oczekiwaną wartość maksymalnej długości między dowolnymi dwoma kolejnymi przyjazdami autobusów, czy jest to właściwe rozwiązanie?

Tak, może być, ale : specyficzny „paradoks” idzie w parze ze szczególnym stochastycznym założeniem: że przyjazdy autobusów są modelowane przez wzorcowy proces Poissona, co oznacza, że w konsekwencji zakładamy, że czas między dowolne dwa kolejne przyjazdy autobusów odbywają się zgodnie z rozkładem wykładniczym. Oznaczają że długość i mamy, że $\ell$

f_{ℓ} (ℓ) = λ e^{- λ ℓ}, λ = 1 / 15, E (ℓ) = 15

$f_{\ell}(\ell) = \lambda e^{-\lambda \ell},\;\; \lambda = 1/15,\;\; E(\ell) = 15$

Jest to oczywiście przybliżone, ponieważ rozkład wykładniczy ma nieograniczone poparcie z prawej strony, co oznacza, że ściśle mówiąc „wszystkie możliwe czasy oczekiwania” obejmują, zgodnie z tym założeniem modelowania, większe i duże wielkości aż do „nieskończoności”, ale z znikającym prawdopodobieństwem .

Ale czekaj, wykładniczy jest bez pamięci : bez względu na to, w którym momencie dotrzemy , napotkamy tę samą zmienną losową , niezależnie od tego, co się działo wcześniej.

Biorąc pod uwagę to stochastyczne / dystrybucyjne założenie, każdy punkt w czasie jest częścią „przedziału między dwoma kolejnymi przyjazdami autobusów”, którego długość jest opisana przez ten sam rozkład prawdopodobieństwa z wartością oczekiwaną (nie wartością maksymalną) : „Jestem tutaj, jestem otoczona przerwą między dwoma przyjazdami autobusów. Niektóre z nich leżą w przeszłości, a niektóre w przyszłości, ale nie mam pojęcia, ile i ile, więc najlepiej mogę zapytać, jaka jest jego przewidywana długość - jaki będzie mój średni czas oczekiwania? ” - I niestety odpowiedź brzmi „ ”. $15$ $15$

Alecos Papadopoulos
źródło

f_{ℓ} (ℓ)

$f_\ell(\ell)$

f_{λ} (ℓ)

$f_\lambda(\ell)$

f_{X} (y)

$f_X(y)$

80

Jeśli autobus przyjeżdża „co 15 minut” (tj. Zgodnie z rozkładem jazdy), wówczas średni czas oczekiwania (przypadkowo przybywającego) pasażera wynosi zaledwie 7,5 minuty, ponieważ będzie on równomiernie rozłożony w tej 15-minutowej przerwie.

-

Z drugiej strony, jeśli autobus przyjeżdża losowo ze średnią prędkością 4 na godzinę (tj. Zgodnie z procesem Poissona), wówczas średni czas oczekiwania jest znacznie dłuższy; rzeczywiście możesz to rozwiązać poprzez brak właściwości pamięci. Przyjmij przybycie pasażera na początek, a czas do następnego wydarzenia jest wykładniczy i trwa średnio 15 minut.

Pozwól, że wezmę dyskretną analogię czasową. Wyobraź sobie, że rzucam kostką z 15 twarzami, z których jedna jest oznaczona „B” (dla autobusu), a 14 z etykietą „X” za całkowity brak autobusu w tej minucie (istnieją dość 30-stronne kości , więc mógłbym oznaczyć 2 z twarze 30-stronnej kostki „B”). Więc raz na minutę toczę się i sprawdzam, czy autobus jedzie. Kostka nie ma pamięci; nie wie ile to było rzutów od ostatniego „B”. Teraz wyobraź sobie, że wydarzyło się jakieś niepowiązane wydarzenie - szczeka pies, przybywa pasażer, słyszę grzmot. Od teraz, jak długo muszę czekać (ile rzutów) do następnego „B”?

Z powodu braku pamięci średnio czekam na ten sam czas „B”, jak między dwoma kolejnymi „B”.

[Następnie wyobraź sobie, że mam 60-stronną kostkę, którą rzucam co piętnaście sekund (ponownie, z jedną twarzą „B”); teraz wyobraź sobie, że miałem 1000-stronną kostkę, którą rzucałem co 0,9 sekundy (z jedną twarzą „B”; lub bardziej realistycznie, trzy 10-stronne kostki każda i nazywam wynik „B”, jeśli wszystkie 3 pojawią się „10” przy w tym samym czasie) ... i tak dalej. W limicie otrzymujemy ciągły proces Poissona.]

$t$ $t$

Jako doświadczony łapacz autobusów, w praktyce wydaje się, że rzeczywistość leży gdzieś pomiędzy „autobusami przyjeżdżają zgodnie z rozkładem jazdy” a „autobusami przyjeżdżają losowo”. A czasem (przy złym ruchu) czekasz godzinę, a potem 3 przyjeżdżają naraz (Zach podaje przyczynę tego w komentarzach poniżej).

Glen_b
źródło

6

Myślę, że w przypadku autobusów istnieje dodatkowy proces, w którym spóźniony autobus staje się później, gdy pasażerowie wjeżdżają na niego, a pusty autobus za nim w końcu dogania (ale pozostaje pusty). = D

Zach.

4

@Zach rzeczywiście, dlatego mają tendencję do grupowania się na długich odcinkach, szczególnie w dużym ruchu. Tam, gdzie mieszkam, kiedy autobus jedzie tak późno, nadszedł czas na następny, czasami wstawią dodatkowy autobus, który jest prawie na czasie dalej na trasie (tj. Będzie jechał bez pasażerów do miejsca, w którym autobus nie byłby bardzo daleko w tyle rozkład jazdy, często docierając tam szybszą trasą) i zacznij odbierać pasażerów, dla których autobus jest już trochę spóźniony. Tymczasem bardzo późny autobus staje się teraz faktycznie kolejnym autobusem w rozkładzie jazdy, gdy dotrze do miejsca, w którym przyjechał drugi autobus.

Glen_b

@Glen_b To naprawdę dobry pomysł, hah!

Zach.

Jest to przydatna strategia zapobiegająca zbrylaniu się (przynajmniej łagodzi najgorsze przypadki); Nie poruszyłbym tego, poza tym, że dotyczy to problemów związanych z zależnościami, z którymi mogą być bardziej dokładne modele czasu oczekiwania na autobus.

Glen_b

10

Więcej o autobusach ... Przykro mi, że wtrącałem się w rozmowę tak późno w dyskusji, ale ostatnio przyglądałem się procesom Poissona ... Więc zanim wymknie mi się z głowy, oto obrazowe przedstawienie paradoksu kontroli :

$\lambda$ $\small \theta=1/\lambda=15$

Gdybyśmy byli w centrum wysyłkowym i moglibyśmy zobaczyć wszystkie autobusy na ekranie, prawdą byłoby, że losowe wybranie wielu autobusów i uśrednienie odległości do autobusu jadącego z tyłu spowodowałoby średni czas między przyjazdem:

Ale jeśli zamiast tego wybieramy się na dworzec autobusowy (zamiast wybierać autobus), wykonujemy losowy przekrój czasu, powiedzmy, wzdłuż osi czasu rozkładu autobusu w typowy poranek. Czas, który zdecydujemy się pojawić na dworcu autobusowym, może równie dobrze być równomiernie rozłożony wzdłuż „strzałki” czasu. Ponieważ jednak istnieją dłuższe luki czasowe między autobusami, które są bardziej oddalone od siebie, istnieje większe prawdopodobieństwo, że nadpróbkujemy tych „maruderów”:

... a zatem nasz dziennik czasu oczekiwania nie będzie odzwierciedlał czasu przybycia. To paradoks inspekcji.

$15'$ $\theta=15$

$\small \mathbb E[\text{time waiting (future) + time to last bus departure (past)}]=30$

Nadal niejasne? - spróbuj z Legos .

Antoni Parellada
źródło

Doskonałe diagramy.

Glen_b

2

Istnieje proste wyjaśnienie, które rozwiązuje różne odpowiedzi, które można uzyskać na podstawie obliczenia oczekiwanego czasu oczekiwania na autobusy przyjeżdżające na proces Poissona przy danym średnim czasie międzyprzyjazdowym (w tym przypadku 15 minut), którego czasy międzystrefowe są zatem wykładnicze w ciągu 15 minut .

Metoda 1 ) Ponieważ proces Poissona (wykładniczy) nie ma pamięci, oczekiwany czas oczekiwania wynosi 15 minut.

Metoda 2 ) Równie prawdopodobne jest przybycie w dowolnym momencie w okresie międzywojennym, w którym przyjeżdżasz. Dlatego oczekiwany czas oczekiwania wynosi 1/2 oczekiwanej długości tego okresu międzywojennego. TO JEST PRAWIDŁOWE i nie powoduje konfliktu z metodą (1).

W jaki sposób (1) i (2) mogą być poprawne? Odpowiedź jest taka, że oczekiwany czas międzyobjawowy dla czasu przybycia nie wynosi 15 minut. To właściwie 30 minut; a 1/2 z 30 minut to 15 minut, więc (1) i (2) zgadzają się.

Dlaczego okres międzyarrivalny dla czasu przybycia nie jest równy 15 minut? Dzieje się tak dlatego, że po pierwszym „ustaleniu” czasu przybycia, okres międzyarrivalny, w którym się znajduje, jest bardziej niż średni, gdy jest to długi okres międzyarrivalny. W przypadku wykładniczego okresu międzywojennego matematyka się sprawdza, więc okres międzywojowy zawierający czas przybycia jest wykładniczy z podwójnym średnim czasem międzyrzędowym dla procesu Poissona.

Nie jest oczywiste, że dokładny rozkład czasu międzyobsługowego zawierający czas przybycia byłby wykładniczy z podwójną średnią, ale po wyjaśnieniu oczywiste jest, dlaczego jest on zwiększany. Jako łatwy do zrozumienia przykład, powiedzmy, że czasy międzywęzłowe wynoszą 10 minut z prawdopodobieństwem 1/2 lub 20 minut z prawdopodobieństwem 1/2. W takim przypadku 20-minutowe okresy międzyżebrowe są równie prawdopodobne, jak 10-minutowe okresy międzyżebrowe, ale kiedy się pojawiają, trwają dwa razy dłużej. Tak więc 2/3 punktów czasowych w ciągu dnia będzie miało miejsce w czasie, w którym okres międzyarrivalny wynosi 20 minut. Innymi słowy, jeśli najpierw wybieramy czas, a następnie chcemy dowiedzieć się, jaki jest czas międzyobrotowy zawierający ten czas, wówczas (ignorując przejściowe efekty na początku „dnia” ) oczekiwany czas tego międzygwarantowego czasu wynosi 16 1/3. Ale jeśli najpierw wybieramy czas międzyobsługowy i chcemy wiedzieć, jaka jest jego przewidywana długość, to 15 minut.

Istnieją inne warianty paradoksu odnawiania, próbkowania z tendencją do długości itp., Które w zasadzie są takie same.

Przykład 1) Masz kilka żarówek o losowych okresach życia, ale średnio 1000 godzin. Gdy żarówka ulegnie awarii, jest natychmiast zastępowana inną żarówką. Jeśli wybierzesz czas, aby przejść do pokoju z żarówką, wówczas żarówka w działaniu skończy się, a jej średni okres użytkowania będzie dłuższy niż 1000 godzin.

Przykład 2) Jeśli pójdziemy na plac budowy w danym czasie, wtedy średni czas do momentu, gdy pracownik budowlany, który tam pracuje, spadnie z budynku (od momentu rozpoczęcia pracy) jest dłuższy niż średni czas do momentu, gdy pracownik wypada (od momentu rozpoczęcia pracy) spośród wszystkich pracowników, którzy zaczynają pracę. Dlaczego, ponieważ pracownicy z krótkim średnim czasem do upadku częściej niż przeciętnie już odpadli (i nie kontynuowali pracy), tak więc pracownicy, którzy pracują, mieli więcej czasu niż przeciętnie do odpadnięcia.

Przykład 3) Wybierz losowo skromną liczbę osób w mieście, a jeśli uczestniczyły w meczach domowych (nie wszystkie wyprzedają się) drużyny baseballowej Major League w mieście, dowiedz się, ile osób uczestniczyło w grach, w których uczestniczyły. Następnie (przy niektórych nieco wyidealizowanych, ale niezbyt nieuzasadnionych założeniach), średnia frekwencja w tych grach będzie wyższa niż średnia frekwencja we wszystkich meczach u siebie w drużynie. Dlaczego? Ponieważ jest więcej osób, które uczęszczały na gry o wysokiej frekwencji niż na gry o niskiej frekwencji, więc istnieje większe prawdopodobieństwo, że wybierzesz osoby, które uczęszczały na gry o wysokiej frekwencji niż na gry o niskiej frekwencji.

Mark L. Stone
źródło

0

Pytanie brzmiało: „... autobus przyjeżdża na przystanek co 15 minut, a pasażer przyjeżdża losowo”. Jeśli autobus przyjeżdża co 15 minut, to nie jest przypadkowy; przybywa co 15 minut, więc prawidłowa odpowiedź to 7,5 minuty. Albo źródło było niepoprawnie cytowane, albo autor źródła był niechlujny.

Z drugiej strony detektor promieniowania brzmi jak inny problem, ponieważ zdarzenia radiacyjne dochodzą losowo zgodnie z pewnym rozkładem, prawdopodobnie podobnym do Poissona ze średnim czasem oczekiwania.

Emil Friedman
źródło

Proszę wyjaśnić paradoks oczekiwania

Odpowiedzi: