Mam bazę danych zdarzeń (tj. Zmienną dat) i powiązanych zmiennych towarzyszących.
Zdarzenia są generowane przez niestacjonarny proces Poissona z parametrem będącym nieznaną (ale być może liniową) funkcją niektórych zmiennych towarzyszących.
Myślę, że pakiet NHPoisson istnieje właśnie w tym celu; ale po 15 godzinach nieudanych badań wciąż nie jestem w pobliżu, aby dowiedzieć się, jak z niego korzystać.
Heck, nawet próbowałem czytać obie przywoływane książki: Coles, S. (2001). Wprowadzenie do modelowania statystycznego wartości ekstremalnych. Skoczek. Casella, G. i Berger, RL, (2002). Wnioskowanie statystyczne. Brooks / Cole.
Jeden przykład w dokumentacji fitPP.fun wydaje się nie pasować do mojej konfiguracji; Nie mam ekstremalnych wartości! Mam tylko nagie wydarzenia.
Czy ktoś może mi pomóc z prostym przykładem dopasowania procesu Poissona za pomocą parametru do pojedynczej zmiennej objaśniającej X i założenia, że λ = λ 0 + α ⋅ X ? Interesuje mnie oszacowanie λ 0 i . Podaję dwukolumnowy zestaw danych z czasami zdarzeń (powiedzmy, mierzonymi w sekundach po pewnym dowolnym czasie ) i kolejną kolumnę z wartościami współzmiennej ?t 0 X
źródło
Odpowiedzi:
Dopasowanie stacjonarnego procesu Poissona
Przede wszystkim należy zdać sobie sprawę, jakiego rodzaju danych wejściowych potrzebuje NHPoisson.
Przede wszystkim NHPoisson potrzebuje listy wskaźników momentów zdarzeń. Jeśli rejestrujemy przedział czasowy i liczbę zdarzeń w danym przedziale czasowym, wówczas musimy go przetłumaczyć na pojedynczą kolumnę dat, prawdopodobnie „rozmazując” daty w przedziale, w którym są rejestrowane.
To
simNHP.fun
sprawia, że symulacja. Używamy getaux$posNH
, zmiennej ze wskaźnikami momentów symulowanego odpalenia zdarzenia. Widzimy, że z grubsza mamy 60 * 24 = 1440 zdarzeń, sprawdzając `length (aux $ posNH).fitPP.fun
fitPP
Więc co robimy w rzeczywistości jest to, że możemy w przybliżeniu proces Poissona z granulowanym sekwencji dwumiennych zdarzeń, każdy przęsła zdarzeń dokładnie jedna jednostka czasu, w sposób analogiczny do mechanizmu, w którym rozkład Poissona może być postrzegane jako ograniczenie rozkładu dwumianowego w prawo rzadkich wydarzeń .
Kiedy to zrozumiemy, reszta jest znacznie prostsza (przynajmniej dla mnie).
beta
exp(coef(out)[1])
NHPoisson
Dopasowanie niestacjonarnego procesu Poissona
NHPoisson
pasuje do następującego modelu:Teraz przygotujmy niestacjonarny proces Poissona.
Tak jak poprzednio,
aux$posNH
dałby nam wskaźniki zdarzeń, ale tym razem zauważymy, że intensywność wydarzeń maleje wykładniczo z czasem. Szybkość tego zmniejszania się jest parametrem, który chcemy oszacować.Ważne jest, aby pamiętać, że musimy
all.seconds
podawać jako zmienną towarzyszącą, a nielambdas
. Potęgowanie / logarytmizacja odbywa się wewnętrznie przezfitPP.fun
. BTW, oprócz przewidywanych wartości, funkcja domyślnie tworzy dwa wykresy.Ostatni kawałek jest funkcją szwajcarski nóż do walidacji modelu
globalval.fun
.Między innymi funkcja dzieli czas na przedziały, każda
lint
próbka jest długa, więc możliwe jest tworzenie surowych wykresów, które porównują przewidywane natężenie z obserwowanym natężeniem.źródło