Przykłady procesów, które nie są Poissonem?

15

Szukam kilku dobrych przykładów sytuacji, które nie pasują do modelu z rozkładem Poissona, aby pomóc mi wyjaśnić rozkład Poissona studentom.

Często wykorzystuje się liczbę klientów przybywających do sklepu w przedziale czasowym jako przykład, który można modelować za pomocą rozkładu Poissona. Szukam kontrprzykładu w podobnym stylu, tj. Sytuacji, którą można traktować jako proces zliczania dodatniego w ciągłym czasie, co oczywiście nie jest Poissonem.

Sytuacja powinna być możliwie jak najprostsza i najprostsza, aby ułatwić uczniom zrozumienie i zapamiętanie.

Nagel
źródło
5
To pytanie jest niezwykle szerokie. Jeśli zakres nie zostanie zawężony i nie zostanie dodany więcej kontekstu, istnieje duże prawdopodobieństwo, że zostanie zamknięty. Bez znaczenia, by zabrzmieć niepotrzebnie surowo, przypomina pytanie: „Jakie są przykłady kwiatów, które nie są czerwone?” (Cue Harry Chapin.)
kardynał
1
Punkt wzięty. Przepraszam. Powinienem był uściślić. Zredagowałem go, aby uczynić go bardziej zrozumiałym.
Nagel
1
(+1) do pytania i komentarza. Aktualizacja jest znacznie lepsza. :-)
kardynał
2
Zakładam, że masz na myśli „dane procesy, dla których ludzie mogą przynajmniej naiwnie rozważyć Poissona” (np. Przynajmniej proces zliczania). Typowy przykład występuje w liczbie roszczeń z polis ubezpieczenia ogólnego (ubezpieczenia P&C), ze względu na szereg możliwych czynników, które najwyraźniej odzwierciedlają się w niejednorodności stawek roszczeń - więc istnieje superpozycja procesów Poissona o różnych natężeniach. W sytuacjach, w których rozkład stawek roszczeń jest dobrze przybliżony przez rozkład gamma, rozkład liczby roszczeń jest z kolei aproksymowany przez ujemny dwumian.
Glen_b

Odpowiedzi:

5

Liczba papierosów wypalonych w danym czasie: wymaga to procesu z zerowym napełnieniem (np. Zerowym napełnionym Poissonem lub zerowym napełnionym ujemnym dwumianem), ponieważ nie wszyscy palą papierosy.

Alexis
źródło
Dzięki! Wielu tutaj wspomniało o procesach o zerowym napełnieniu, ale myślę, że jest to najprostszy i ilustrujący przykład, jaki podano: liczbę papierosów palonych przez przypadkowo wybraną osobę w danym okresie czasu.
Nagel
Istnieje jednak pewna sprzeczka z argumentem „nie wszyscy palą papierosy”, ponieważ można twierdzić, że ten proces jest nadal Poissonem, tylko że parametr intensywności jest specyficzny dla każdej osoby i nieznany (osoby niepalące miałyby bardzo małe intensywność) - prawda? Można jednak również argumentować, że sytuacja ta narusza założenia Poissona, ponieważ palone papierosy miałyby tendencję do równomiernego rozłożenia w ciągu dnia (dla zwykłych palaczy) lub klastra (dla palaczy towarzyskich), tak że rozłączne przedziały czasowe nie są niezależne. Myślę, że to wciąż dobry przykład.
Nagel
1
Liczba ryb złowionych w danym okresie czasu jest, moim zdaniem, bardziej kanonicznym przykładem dla ZIP i ZINB. Podobne argumenty. Chociaż ryby nie mają potencjalnie uzależniającego wpływu na tempo spożycia. (Wiem, wiem, z wyjątkiem ryb twojej mamy, bo są takie dobre :).
Alexis
8

Czy masz na myśli dane dodatnie? Bezgraniczny?

Ujemny dwumian jest popularny.

Innym dobrym modelem jest Poisson z zawyżonym 0. Model ten zakłada, że ​​albo coś się dzieje, albo tak nie jest - a jeśli tak, to następuje Poissona. Ostatnio widziałem przykład. Pielęgniarki, które leczyły pacjentów z AIDS, zostały zapytane, jak często doświadczały stygmatyzujących zachowań innych osób w wyniku ich zaangażowania w pacjentów z AIDS. Wielu nigdy nie miało takich doświadczeń, być może z powodu miejsca pracy lub zamieszkania. Spośród tych osób liczba stygmatyzujących doświadczeń była różna. Zgłoszono więcej zer, niż można się spodziewać po prostym Poissonie, zasadniczo dlatego, że pewna część badanej grupy po prostu nie znajdowała się w środowisku, które narażało ich na takie zachowania.

Mieszanka Poissona również da ci punktowy proces.

Placidia
źródło
(+1) dla zera napompowanego rozkładu Poissona. Dyskusję na temat tego modelu można znaleźć tutaj
1
+1 do tego (i innych odpowiedzi), które dostarczają rzeczywistych przykładów sytuacji, o których mowa w pytaniu, a nie tylko abstrakcyjne rozkłady. Ten przykład ZIP jest szczególnie jasny.
whuber
1
Trzeba podziękować tym, którzy odpowiedzieli, że moje pytanie początkowo było zbyt niechlujne i w ogóle nie odnosiło się do sytuacji. Zgadzam się, że poison o zerowej wartości jest dobrym przykładem. Jednak uważam, że jest to zbyt skomplikowane, aby wyjaśnić studentom studiów licencjackich, więc wciąż brakuje mi przykładów prostych sytuacji, których nie można modelować rozkładem Poissona.
Nagel
4

Zliczanie procesów, które nie są Poissonem? Cóż, każdy skończony proces przestrzeni próbki, taki jak dwumianowy lub dyskretny jednolity. Otrzymujesz proces zliczania Poissona z liczenia zdarzeń o niezależnych czasach międzywirusowych, które są wykładniczo rozłożone wykładniczo, więc całe mnóstwo uogólnień wypada z tego, takich jak gamma lub lognormalne lub Weibull rozproszone czasy międzyrzędowe, lub jakikolwiek abstrakcyjny nieparametryczny czas międzyrzędowy dystrybucja.

AdamO
źródło
Dziękuję za odpowiedź i bardzo mi przykro, że moje pytanie na początku było tak niejasne. Wyjaśniłem to teraz. To, co mówisz o procesach z niewykładniczym i / lub zależnym czasem międzyżebrowym, ma sens, ale czy masz jakieś przykłady sytuacji, które będą miały te właściwości, im prościej, tym lepiej?
Nagel
4
Obstawiasz! Czas między wybuchami wirusa opryszczki. Masz dużo więcej czasu do początkowej epidemii, ponieważ musisz zarazić się wirusem. Późniejsze czasy między epidemiami są niezależne od siebie, ale są znacznie szybsze w stosunku do wybuchu indeksu. Nie wykładnicze czasy międzywęzłowe są normą. W analizie przeżycia powszechnie stosowaną metodą analityczną są modele hazardu proporcjonalnego Coxa, w których usuwa się wszelkie parametryczne założenia dotyczące czasów międzywęzłowych.
AdamO,
Dobry przykład! Wydaje mi się, że jest to kolejny przykład zerowo napompowanego Poissona wspomnianego powyżej przez Placidię?
Nagel
4

Nie jest jasne, czy chcesz zliczać procesy, czy nie.

Jeśli interpretuję znacznik „nauczanie” w ten sposób, że uczysz procesu Poissona, to w przypadku nauczania o procesie ogólnie proces Bernoulliego jest łatwym, losowym procesem do wyjaśnienia i wizualizacji i jest powiązany z procesem Poissona. Proces Bernoulliego jest dyskretnym analogiem, więc może być pomocną koncepcją towarzyszącą. Po prostu zamiast ciągłego czasu mamy dyskretne przedziały czasu.

Przykładem może być sprzedawca od drzwi do drzwi, w którym liczymy sukcesy domów, które dokonują zakupu.

  • Liczba sukcesów w pierwszych n próbach ma
    rozkład dwumianowy B (n, p) zamiast Poissona
  • Liczba prób potrzebnych do uzyskania sukcesów r ma ujemny rozkład dwumianowy NB (r, p) zamiast rozkładu gamma
  • Liczba prób potrzebnych do osiągnięcia jednego sukcesu, czasu oczekiwania, ma rozkład geometryczny NB (1, p), który jest dyskretnym analogiem wykładniczym.

Takie podejście zastosowali Bertsekas i Tsitsiklis we Wstępie do prawdopodobieństwa , wyd. 2, wprowadzając proces Bernoulliego przed procesem Poissona. W ich podręczniku jest więcej rozszerzeń procesu Bernoulliego, które mają zastosowanie do procesu Poissona, takich jak łączenie ich lub dzielenie na partycje, a także zestawy problemów z rozwiązaniami.

Jeśli szukasz przykładów losowych procesów, a chcesz po prostu rzucić tam nazwy, jest ich sporo.

Proces gaussowski jest znaczący w zastosowaniach. W szczególności proces Weinera, który jest rodzajem procesu Gaussa, jest również nazywany standardowym ruchem Browna i ma zastosowanie w finansach i fizyce.

Meadowlark Bradsher
źródło
Dziękuję za odpowiedź i bardzo mi przykro, że moje pytanie było początkowo tak dziwne i niejasne. Próbowałem to teraz wyjaśnić. Link z Bernoulliego do Poissona jest interesujący, ale szukam przykładów sytuacji w ciągłym czasie, które nie nadają się do modelowania rozkładem Poissona, im prościej, tym lepiej.
Nagel
3

Jako aktuariusz od nieruchomości / poszkodowanych mam do czynienia z rzeczywistymi przykładami dyskretnych procesów, które przez cały czas nie są Poissonem. W przypadku linii biznesowych o wysokiej istotności i niskiej częstotliwości rozkład Poissona jest nieodpowiedni, ponieważ wymaga stosunku wariancji do średniej równej 1. Negatywny rozkład dwumianowy, wspomniany powyżej, jest znacznie częściej stosowany, a rozkłady Delaporte jest stosowany w niektórych literaturach, choć rzadziej w standardowej praktyce aktuarialnej w Ameryce Północnej.

Dlaczego tak jest, jest głębsze pytanie. Czy ujemny dwumian jest o wiele lepszy, ponieważ reprezentuje proces Poissona, dla którego sam parametr średni jest rozkładany gamma? A może dlatego, że występowanie strat zawodzi w niezależności (tak jak dzieje się w przypadku trzęsień ziemi zgodnie z obecną teorią, że im dłużej ziemia czeka na poślizg ziemi, tym bardziej prawdopodobne jest, że jest to spowodowane wzrostem ciśnienia), czy jest niestacjonarna (interwały nie można podzielić na sekwencje, z których każda jest stacjonarna, co pozwoliłoby na użycie niejednorodnego Poissona), a na pewno niektóre linie biznesowe pozwalają na jednoczesne wystąpienie (np. błąd w sztuce lekarskiej z wieloma lekarzami objętymi polisą).

Avraham
źródło
2

Inni wspominali kilka przykładów procesu punktowego, które nie są Poissonem. Ponieważ Poissona odpowiada wykładniczemu czasowi międzyżebrowemu, jeśli wybierzesz dowolny międzyzębowy rozkład czasu, który nie jest wykładniczy, wynikowy proces punktowy nie jest Poissonem. AdamO zwrócił uwagę na Weibulla. Jako opcji możesz użyć gamma, lognormal lub beta.

Poisson ma właściwość, której średnia jest równa jego wariancji. Proces punktowy, w którym wariancja jest większa niż średnia, jest czasami określany jako nadmiernie rozproszony, a jeśli średnia jest większa niż wariancja, jest niedostatecznie rozproszona. Terminy te są używane do powiązania procesu z Poissonem. Ujemny dwumian jest często stosowany, ponieważ może być rozproszony lub rozproszony w zależności od jego parametrów.

Poisson ma stałą wariancję. Proces punktowy, który pasuje do warunków Poissona, z wyjątkiem tego, że nie ma parametru stałej prędkości, aw konsekwencji średniej zmieniającej się w czasie średniej i wariancji, nazywa się niejednorodnym Poissonem.

Proces z wykładniczym czasem interarrival, ale może mieć wiele zdarzeń w czasie przybycia, nazywa się złożonym Poissonem. Chociaż są podobne do procesu Poissona i mają nazwę ze słowem Poisson, niejednorodne i złożone procesy Poissona różnią się od procesu punktu Poissona.

Michael R. Chernick
źródło
Dziękuję za odpowiedź i bardzo mi przykro, że moje pytanie było początkowo tak dziwne i niejasne. Próbowałem to teraz wyjaśnić. Wspominasz procesy z niewykładniczym i / lub zależnym czasem międzyarrivalnym, a to, co mówisz o nadmiernie i rozproszonych rozkładach jest bardzo interesujące, ale czy masz jakieś przykłady konkretnych sytuacji, które będą miały te właściwości? Im prościej, tym lepiej :)
Nagel
1
Zamiast próbować dać własną odpowiedź, myślę, że jest naprawdę wiele, wiele przykładów, które można znaleźć w książkach dotyczących procesów liczenia. Pozwól, że polecę przyjrzeć się książce Joe Hilbe o negatywnej regresji dwumianowej .
Michael R. Chernick,
2

Innym interesującym przykładem procesu zliczania nie Poissona jest skrócona przez zero dystrybucja Poissona (ZTPD). ZTPD może zmieścić dane dotyczące liczby języków, w których badani mogą mówić w warunkach fizjologicznych. W tym przypadku rozkład Poissona jest niewłaściwy, ponieważ liczba języków mówionych jest z definicji> = 1: stąd z góry wyklucza się 0.

Carlo Lazzaro
źródło
2

Wierzę, że możesz wziąć proces Poissona po przybyciu klienta i dostosować go na dwa różne sposoby: 1) przyjazdy klientów są mierzone 24 godziny na dobę, ale sklep nie jest otwarty przez cały dzień, i 2) wyobraź sobie dwa konkurencyjne sklepy z Poisson przetwarza czasy przybycia klientów i przygląda się różnicy między przylotami do dwóch sklepów. (Przykład 2 pochodzi z mojej wiedzy na temat Springera Handbook of Engineering Statistics, część A, własność 1.4.)

Wayne
źródło
1

Możesz ponownie rozważyć przykład piłki nożnej. Wygląda na to, że wskaźniki punktacji dla obu drużyn rosną w miarę trwania meczu i że zmieniają się, gdy drużyny zmieniają swoje priorytety ataku / obrony w odpowiedzi na aktualny wynik.

A raczej użyj go jako przykładu tego, jak proste modele mogą zadziwiająco dobrze działać, stymulując zainteresowanie badaniami statystycznymi niektórych zjawisk i zapewniając punkt odniesienia dla przyszłych badań, które gromadzą więcej danych w celu zbadania rozbieżności i zaproponowania opracowań.

Dixon i Robinson (1998), „A Birth Process Model for Association Football Matches”, The Statistician , 47 , 3.

Scortchi - Przywróć Monikę
źródło
Miałem przeczucie, że mecze piłkarskie nie były całkiem Poissonem, ale dziękuję za referencję :)
Nagel
1

Ponieważ pytanie związane jest z bardziej zrozumiałym rozkładem Poissona, spróbuję, ponieważ ostatnio zastanawiałem się nad wzorcami połączeń przychodzących call center (które podążają za rozkładem wykładniczym bez pamięci w miarę upływu czasu).

Myślę, że zagłębianie się w inny model styczny, który zasadniczo wymaga znajomości Poissona, aby zdać sobie sprawę z tego, że to nie jeden, może być nieco mylące, ale to tylko ja.

Myślę, że problem ze zrozumieniem Poissona polega na tym, że jest to ciągła oś czasu - z każdą kolejną sekundą wydarzenie nie jest już prawdopodobne - ale im dalej w przyszłości, tym bardziej pewne jest, że wydarzenie.

Naprawdę myślę, że to ułatwia zrozumienie, jeśli po prostu zamieniasz oś „czasu” na „próby” lub „wydarzenia”.

Ktoś może mnie poprawić, jeśli nie jest to podstawa, ponieważ uważam, że jest to łatwe wytłumaczenie, ale myślę, że możesz zastąpić rzut monetą lub rzut kostką, „czasem, aż nadejdzie telefon” (co ja zwykle stosuje się w przypadku personelu Erlang C / call center).

Zamiast „czasu, aż nadejdą połączenia telefoniczne” ---- możesz go zastąpić ... rzutami, aż kostka osiągnie szóstkę.

Wynika to z tej samej ogólnej logiki. Prawdopodobieństwo (jak każde hazard) jest całkowicie niezależne przy każdym rzucie (lub minucie) i nie ma pamięci. Jednak prawdopodobieństwo „nr 6” maleje coraz wolniej, ale z pewnością do zera w miarę zwiększania liczby prób. Łatwiej jest zobaczyć oba wykresy (prawdopodobieństwo połączenia z czasem, a prawdopodobieństwo sześciu z rzutami).

Nie wiem, czy to ma sens - właśnie to pomogło mi ułożyć to w konkretny sposób. Teraz rozkład Poissona jest liczeniem, a nie „czasem między rozmowami” lub „próbami do wyrzucenia szóstki” - ale zależy od tego prawdopodobieństwa.

John Babson
źródło
Widzę, jak według ciebie mogłoby to być mylące dla studentów, ale moim pomysłem było po prostu, że łatwiej byłoby mi wyjaśnić, dlaczego liczba klientów przybywających do restauracji w określonym przedziale czasowym to Poisson, gdybym miał licznik -przykład prostego procesu z dyskretnymi zdarzeniami w ciągłym czasie, który nie był Poissonem.
Nagel
1
Myślę, że istnieje wiele opcji. Jednym oczywistym wzorcem są zdarzenia, które zwiększają lub zmniejszają prawdopodobieństwo wraz z własnymi zdarzeniami. Trudno wymyślić kilka przykładów. Być może mrówki przybywają do kuchni / pikniku. Czas potrzebny na przybycie pierwszej mrówki jest prawdopodobnie znacznie dłuższy niż na drugą lub trzecią, i oczywiście więcej przybywających mrówek oznacza bardziej prawdopodobne przyszłe przybycie mrówek (biorąc pod uwagę, że ich szlaki / komunikacja ze sobą). Nie jestem pewien, czy to by się liczyło.
John Babson,
1

Liczba wizyt indywidualnego klienta w sklepie spożywczym w danym przedziale czasu.

Po przejściu do sklepu spożywczego raczej nie wrócisz przez jakiś czas, chyba że popełnisz błąd w planowaniu.

Myślę, że można tu zastosować ujemny rozkład dwumianowy, ale jest on dyskretny, podczas gdy wizyty odbywają się w sposób ciągły.

Josiah Yoder-deactive oprócz…
źródło