Ze względu na silnię w rozkładzie Poissona oszacowanie modeli Poissona (na przykład przy użyciu maksymalnego prawdopodobieństwa) staje się niepraktyczne, gdy obserwacje są duże. Na przykład, jeśli próbuję oszacować model wyjaśniający liczbę samobójstw w danym roku (dostępne są tylko dane roczne) i powiedzmy, że są tysiące samobójstw każdego roku, czy błędne jest wyrażanie samobójstw w setkach , więc 2998 wyniesie 29,98 ~ = 30? Innymi słowy, czy błędem jest zmiana jednostki miary, aby dane były możliwe do zarządzania?
n!
= =Gamma(n+1)
n> = 0. Spróbuj więc wyszukać funkcję wywoływaną,Gamma
jeśli chcesz obliczyć silnię (lub log Gamma, jeśli obliczasz prawdopodobieństwo logarytmu)Obawiam się, że nie możesz tego zrobić. Jak stwierdza @Baltimark, przy dużej lambdzie rozkład będzie miał bardziej normalny kształt (symetryczny), a po skalowaniu nie będzie już rozproszenia poissona. Wypróbuj następujący kod w R:
Wynik jest poniżej:
Widać, że przeskalowany w dół Poissona (czerwona linia) jest zupełnie inny niż rozkład Poissona.
źródło
Możesz po prostu zignorować „silnia”, gdy używasz największego prawdopodobieństwa. Oto uzasadnienie twojego przykładu samobójstwa. Pozwolić:
λ: Bądź oczekiwaną liczbą samobójstw rocznie
k i : być liczbą samobójstw w roku i.
Następnie zmaksymalizujesz prawdopodobieństwo dziennika jako:
LL = ∑ (k i log (λ) - λ - k i !)
Maksymalizacja powyższego jest równoznaczna z maksymalizacją następujących jako k i ! jest stałą:
LL ' = ∑ (k i log (λ) - λ)
Czy może wyjaśnić, dlaczego silnia jest problemem? Czy coś brakuje?
źródło