Próbuję modelować niektóre dane dotyczące czasu przyjazdu pociągu. Chciałbym użyć dystrybucji, która przechwytuje „im dłużej czekam, tym bardziej prawdopodobne jest, że pociąg się pojawi” . Wydaje się, że taka dystrybucja powinna wyglądać jak CDF, więc P (przyjazd pociągu | czekał 60 minut) jest bliski 1. Jakiej dystrybucji należy tutaj zastosować?
distributions
modeling
foobar
źródło
źródło
Odpowiedzi:
Mnożenie dwóch prawdopodobieństw
Prawdopodobieństwo pierwszego przybycia w czasie odt do t+dt (czas oczekiwania) jest równe pomnożeniu
Ten ostatni termin dotyczy:
lub
dający:
a rozkład prawdopodobieństwa dla czasów oczekiwania wynosi:
Wyprowadzenie rozkładu skumulowanego.
Alternatywnie możesz użyć wyrażenia dla prawdopodobieństwa mniej niż jednego przybycia, pod warunkiem, że czas jestt
a prawdopodobieństwo przybycia między czasemt i t+dt jest równe pochodnej
To podejście / metoda jest na przykład przydatna w uzyskiwaniu rozkładu gamma jako czasu oczekiwania na n-ty nadejście procesu Poissona. ( czas oczekiwania poissona-proces-następuje-rozkład gamma )
Dwa przykłady
Możesz to powiązać z paradoksem oczekiwania ( proszę wyjaśnić paradoks oczekiwania ).
Constant distribution: If the arrivals are occurring at a constant rate (such as trains arriving according to a fixed schedule), then the probability of an arrival, when a person has already been waiting for some time, is increasing. Say a train is supposed to arrive everyT minutes then the frequency, after already waiting t minutes is s(t)=1/(T−t) and the pdf for the waiting time will be: f(t)=e∫t0−1T−tdtT−t=1T which makes sense since every time between 0 and T should have equal probability to be the first arrival.
So it is this second case, with "then the probability of an arrival, when a person has already been waiting for some time is increasing", that relates to your question.
It might need some adjustments depending on your situation. With more information the probabilitys(t)dt for a train to arrive at a certain moment might be a more complex function.
Written by StackExchangeStrike
źródło
The classical distribution to model waiting times is the exponential distribution.
źródło