Jakiego rozkładu użyć do modelowania czasu przed przybyciem pociągu?

16

Próbuję modelować niektóre dane dotyczące czasu przyjazdu pociągu. Chciałbym użyć dystrybucji, która przechwytuje „im dłużej czekam, tym bardziej prawdopodobne jest, że pociąg się pojawi” . Wydaje się, że taka dystrybucja powinna wyglądać jak CDF, więc P (przyjazd pociągu | czekał 60 minut) jest bliski 1. Jakiej dystrybucji należy tutaj zastosować?

foobar
źródło
10
Jeśli zaczekasz 25 godzin, a pociągu nie będzie, podejrzewam, że pociąg w kolejce pojawi się w najbliższej minucie może być bliski ponieważ jest całkiem możliwe, że linia została zamknięta czasowo lub na stałe0
Henry
@Henry, zależy to całkowicie od twoich przekonań o wcześniejszych prawdopodobieństwach. Na przykład najmniej używana stacja kolejowa w Wielkiej Brytanii, theguardian.com/uk-news/2016/dec/09/… , ma luki przylotów na więcej niż jeden dzień (w niedziele nie ma usługi).
Sextus Empiricus
@MartijnWeterings - być może dzięki dziennikarzom Shippea Hill odnotowała 1200% wzrost wykorzystania, a nawet nie osiągnęła najniższego 10 wykorzystania w następnym roku , z których niektóre, takie jak lotnisko Teesside, mają jeden pociąg tygodniowo w jednym kierunku
Henry

Odpowiedzi:

17

Mnożenie dwóch prawdopodobieństw

Prawdopodobieństwo pierwszego przybycia w czasie od t do t+dt (czas oczekiwania) jest równe pomnożeniu

  • prawdopodobieństwo, nadejściu pomiędzy t i t+dt (która może być związana z szybkością przylotu s(t) w czasie t )
  • oraz prawdopodobieństwo braku przyjazdu przed czasem t (lub w innym przypadku nie byłby to pierwszy).

Ten ostatni termin dotyczy:

P.(n=0,t+ret)=(1-s(t)ret)P.(n=0,t)

lub

P.(n=0,t)t=-s(t)P.(n=0,t)

dający:

P(n=0,t)=e0ts(t)dt

a rozkład prawdopodobieństwa dla czasów oczekiwania wynosi:

f(t)=s(t)e0ts(t)dt

Wyprowadzenie rozkładu skumulowanego.

Alternatywnie możesz użyć wyrażenia dla prawdopodobieństwa mniej niż jednego przybycia, pod warunkiem, że czas jest t

P(n<1|t)=F(n=0;t)

a prawdopodobieństwo przybycia między czasem t i t+dt jest równe pochodnej

farrival time(t)=ddtF(n=0|t)

To podejście / metoda jest na przykład przydatna w uzyskiwaniu rozkładu gamma jako czasu oczekiwania na n-ty nadejście procesu Poissona. ( czas oczekiwania poissona-proces-następuje-rozkład gamma )


Dwa przykłady

Możesz to powiązać z paradoksem oczekiwania ( proszę wyjaśnić paradoks oczekiwania ).

  • s(t)=λ

    f(t)=λeλt

  • Constant distribution: If the arrivals are occurring at a constant rate (such as trains arriving according to a fixed schedule), then the probability of an arrival, when a person has already been waiting for some time, is increasing. Say a train is supposed to arrive every T minutes then the frequency, after already waiting t minutes is s(t)=1/(Tt) and the pdf for the waiting time will be:

    f(t)=e0t1TtdtTt=1T
    which makes sense since every time between 0 and T should have equal probability to be the first arrival.


So it is this second case, with "then the probability of an arrival, when a person has already been waiting for some time is increasing", that relates to your question.

It might need some adjustments depending on your situation. With more information the probability s(t)dt for a train to arrive at a certain moment might be a more complex function.


Written by StackExchangeStrike

Sextus Empiricus
źródło
7

The classical distribution to model waiting times is the exponential distribution.

The exponential distribution occurs naturally when describing the lengths of the inter-arrival times in a homogeneous Poisson process.

Stephan Kolassa
źródło
2
Yes, but I daresay a Poisson process is not a good model for a train network.
leftaroundabout