Szukam kilku dobrych przykładów sytuacji, które nie pasują do modelu z rozkładem Poissona, aby pomóc mi wyjaśnić rozkład Poissona studentom.
Często wykorzystuje się liczbę klientów przybywających do sklepu w przedziale czasowym jako przykład, który można modelować za pomocą rozkładu Poissona. Szukam kontrprzykładu w podobnym stylu, tj. Sytuacji, którą można traktować jako proces zliczania dodatniego w ciągłym czasie, co oczywiście nie jest Poissonem.
Sytuacja powinna być możliwie jak najprostsza i najprostsza, aby ułatwić uczniom zrozumienie i zapamiętanie.
Odpowiedzi:
Liczba papierosów wypalonych w danym czasie: wymaga to procesu z zerowym napełnieniem (np. Zerowym napełnionym Poissonem lub zerowym napełnionym ujemnym dwumianem), ponieważ nie wszyscy palą papierosy.
źródło
Czy masz na myśli dane dodatnie? Bezgraniczny?
Ujemny dwumian jest popularny.
Innym dobrym modelem jest Poisson z zawyżonym 0. Model ten zakłada, że albo coś się dzieje, albo tak nie jest - a jeśli tak, to następuje Poissona. Ostatnio widziałem przykład. Pielęgniarki, które leczyły pacjentów z AIDS, zostały zapytane, jak często doświadczały stygmatyzujących zachowań innych osób w wyniku ich zaangażowania w pacjentów z AIDS. Wielu nigdy nie miało takich doświadczeń, być może z powodu miejsca pracy lub zamieszkania. Spośród tych osób liczba stygmatyzujących doświadczeń była różna. Zgłoszono więcej zer, niż można się spodziewać po prostym Poissonie, zasadniczo dlatego, że pewna część badanej grupy po prostu nie znajdowała się w środowisku, które narażało ich na takie zachowania.
Mieszanka Poissona również da ci punktowy proces.
źródło
Zliczanie procesów, które nie są Poissonem? Cóż, każdy skończony proces przestrzeni próbki, taki jak dwumianowy lub dyskretny jednolity. Otrzymujesz proces zliczania Poissona z liczenia zdarzeń o niezależnych czasach międzywirusowych, które są wykładniczo rozłożone wykładniczo, więc całe mnóstwo uogólnień wypada z tego, takich jak gamma lub lognormalne lub Weibull rozproszone czasy międzyrzędowe, lub jakikolwiek abstrakcyjny nieparametryczny czas międzyrzędowy dystrybucja.
źródło
Nie jest jasne, czy chcesz zliczać procesy, czy nie.
Jeśli interpretuję znacznik „nauczanie” w ten sposób, że uczysz procesu Poissona, to w przypadku nauczania o procesie ogólnie proces Bernoulliego jest łatwym, losowym procesem do wyjaśnienia i wizualizacji i jest powiązany z procesem Poissona. Proces Bernoulliego jest dyskretnym analogiem, więc może być pomocną koncepcją towarzyszącą. Po prostu zamiast ciągłego czasu mamy dyskretne przedziały czasu.
Przykładem może być sprzedawca od drzwi do drzwi, w którym liczymy sukcesy domów, które dokonują zakupu.
rozkład dwumianowy B (n, p) zamiast Poissona
Takie podejście zastosowali Bertsekas i Tsitsiklis we Wstępie do prawdopodobieństwa , wyd. 2, wprowadzając proces Bernoulliego przed procesem Poissona. W ich podręczniku jest więcej rozszerzeń procesu Bernoulliego, które mają zastosowanie do procesu Poissona, takich jak łączenie ich lub dzielenie na partycje, a także zestawy problemów z rozwiązaniami.
Jeśli szukasz przykładów losowych procesów, a chcesz po prostu rzucić tam nazwy, jest ich sporo.
Proces gaussowski jest znaczący w zastosowaniach. W szczególności proces Weinera, który jest rodzajem procesu Gaussa, jest również nazywany standardowym ruchem Browna i ma zastosowanie w finansach i fizyce.
źródło
Jako aktuariusz od nieruchomości / poszkodowanych mam do czynienia z rzeczywistymi przykładami dyskretnych procesów, które przez cały czas nie są Poissonem. W przypadku linii biznesowych o wysokiej istotności i niskiej częstotliwości rozkład Poissona jest nieodpowiedni, ponieważ wymaga stosunku wariancji do średniej równej 1. Negatywny rozkład dwumianowy, wspomniany powyżej, jest znacznie częściej stosowany, a rozkłady Delaporte jest stosowany w niektórych literaturach, choć rzadziej w standardowej praktyce aktuarialnej w Ameryce Północnej.
Dlaczego tak jest, jest głębsze pytanie. Czy ujemny dwumian jest o wiele lepszy, ponieważ reprezentuje proces Poissona, dla którego sam parametr średni jest rozkładany gamma? A może dlatego, że występowanie strat zawodzi w niezależności (tak jak dzieje się w przypadku trzęsień ziemi zgodnie z obecną teorią, że im dłużej ziemia czeka na poślizg ziemi, tym bardziej prawdopodobne jest, że jest to spowodowane wzrostem ciśnienia), czy jest niestacjonarna (interwały nie można podzielić na sekwencje, z których każda jest stacjonarna, co pozwoliłoby na użycie niejednorodnego Poissona), a na pewno niektóre linie biznesowe pozwalają na jednoczesne wystąpienie (np. błąd w sztuce lekarskiej z wieloma lekarzami objętymi polisą).
źródło
Inni wspominali kilka przykładów procesu punktowego, które nie są Poissonem. Ponieważ Poissona odpowiada wykładniczemu czasowi międzyżebrowemu, jeśli wybierzesz dowolny międzyzębowy rozkład czasu, który nie jest wykładniczy, wynikowy proces punktowy nie jest Poissonem. AdamO zwrócił uwagę na Weibulla. Jako opcji możesz użyć gamma, lognormal lub beta.
Poisson ma właściwość, której średnia jest równa jego wariancji. Proces punktowy, w którym wariancja jest większa niż średnia, jest czasami określany jako nadmiernie rozproszony, a jeśli średnia jest większa niż wariancja, jest niedostatecznie rozproszona. Terminy te są używane do powiązania procesu z Poissonem. Ujemny dwumian jest często stosowany, ponieważ może być rozproszony lub rozproszony w zależności od jego parametrów.
Poisson ma stałą wariancję. Proces punktowy, który pasuje do warunków Poissona, z wyjątkiem tego, że nie ma parametru stałej prędkości, aw konsekwencji średniej zmieniającej się w czasie średniej i wariancji, nazywa się niejednorodnym Poissonem.
Proces z wykładniczym czasem interarrival, ale może mieć wiele zdarzeń w czasie przybycia, nazywa się złożonym Poissonem. Chociaż są podobne do procesu Poissona i mają nazwę ze słowem Poisson, niejednorodne i złożone procesy Poissona różnią się od procesu punktu Poissona.
źródło
Innym interesującym przykładem procesu zliczania nie Poissona jest skrócona przez zero dystrybucja Poissona (ZTPD). ZTPD może zmieścić dane dotyczące liczby języków, w których badani mogą mówić w warunkach fizjologicznych. W tym przypadku rozkład Poissona jest niewłaściwy, ponieważ liczba języków mówionych jest z definicji> = 1: stąd z góry wyklucza się 0.
źródło
Wierzę, że możesz wziąć proces Poissona po przybyciu klienta i dostosować go na dwa różne sposoby: 1) przyjazdy klientów są mierzone 24 godziny na dobę, ale sklep nie jest otwarty przez cały dzień, i 2) wyobraź sobie dwa konkurencyjne sklepy z Poisson przetwarza czasy przybycia klientów i przygląda się różnicy między przylotami do dwóch sklepów. (Przykład 2 pochodzi z mojej wiedzy na temat Springera Handbook of Engineering Statistics, część A, własność 1.4.)
źródło
Możesz ponownie rozważyć przykład piłki nożnej. Wygląda na to, że wskaźniki punktacji dla obu drużyn rosną w miarę trwania meczu i że zmieniają się, gdy drużyny zmieniają swoje priorytety ataku / obrony w odpowiedzi na aktualny wynik.
A raczej użyj go jako przykładu tego, jak proste modele mogą zadziwiająco dobrze działać, stymulując zainteresowanie badaniami statystycznymi niektórych zjawisk i zapewniając punkt odniesienia dla przyszłych badań, które gromadzą więcej danych w celu zbadania rozbieżności i zaproponowania opracowań.
Dixon i Robinson (1998), „A Birth Process Model for Association Football Matches”, The Statistician , 47 , 3.
źródło
Ponieważ pytanie związane jest z bardziej zrozumiałym rozkładem Poissona, spróbuję, ponieważ ostatnio zastanawiałem się nad wzorcami połączeń przychodzących call center (które podążają za rozkładem wykładniczym bez pamięci w miarę upływu czasu).
Myślę, że zagłębianie się w inny model styczny, który zasadniczo wymaga znajomości Poissona, aby zdać sobie sprawę z tego, że to nie jeden, może być nieco mylące, ale to tylko ja.
Myślę, że problem ze zrozumieniem Poissona polega na tym, że jest to ciągła oś czasu - z każdą kolejną sekundą wydarzenie nie jest już prawdopodobne - ale im dalej w przyszłości, tym bardziej pewne jest, że wydarzenie.
Naprawdę myślę, że to ułatwia zrozumienie, jeśli po prostu zamieniasz oś „czasu” na „próby” lub „wydarzenia”.
Ktoś może mnie poprawić, jeśli nie jest to podstawa, ponieważ uważam, że jest to łatwe wytłumaczenie, ale myślę, że możesz zastąpić rzut monetą lub rzut kostką, „czasem, aż nadejdzie telefon” (co ja zwykle stosuje się w przypadku personelu Erlang C / call center).
Zamiast „czasu, aż nadejdą połączenia telefoniczne” ---- możesz go zastąpić ... rzutami, aż kostka osiągnie szóstkę.
Wynika to z tej samej ogólnej logiki. Prawdopodobieństwo (jak każde hazard) jest całkowicie niezależne przy każdym rzucie (lub minucie) i nie ma pamięci. Jednak prawdopodobieństwo „nr 6” maleje coraz wolniej, ale z pewnością do zera w miarę zwiększania liczby prób. Łatwiej jest zobaczyć oba wykresy (prawdopodobieństwo połączenia z czasem, a prawdopodobieństwo sześciu z rzutami).
Nie wiem, czy to ma sens - właśnie to pomogło mi ułożyć to w konkretny sposób. Teraz rozkład Poissona jest liczeniem, a nie „czasem między rozmowami” lub „próbami do wyrzucenia szóstki” - ale zależy od tego prawdopodobieństwa.
źródło
Liczba wizyt indywidualnego klienta w sklepie spożywczym w danym przedziale czasu.
Po przejściu do sklepu spożywczego raczej nie wrócisz przez jakiś czas, chyba że popełnisz błąd w planowaniu.
Myślę, że można tu zastosować ujemny rozkład dwumianowy, ale jest on dyskretny, podczas gdy wizyty odbywają się w sposób ciągły.
źródło