Regresja Poissona jest GLM z funkcją log-link.
Alternatywnym sposobem modelowania danych liczbowych o rozkładzie innym niż normalny jest przetwarzanie wstępne, biorąc dziennik (a raczej dziennik (1 + liczba) do obsługi zer). Jeśli wykonasz regresję metodą najmniejszych kwadratów w odpowiedziach na logarytm, czy jest to związane z regresją Poissona? Czy poradzi sobie z podobnymi zjawiskami?
regression
poisson-distribution
generalized-linear-model
Brendan OConnor
źródło
źródło
Odpowiedzi:
Z jednej strony w regresji Poissona lewa strona równania modelu jest logarytmem oczekiwanej liczby: .log( E[ Y| x])
Z drugiej strony w „standardowym” modelu liniowym lewa strona to oczekiwana wartość normalnej zmiennej odpowiedzi: . W szczególności funkcja link jest funkcją tożsamości.mi[ Y| x]
Powiedzmy teraz, że jest zmienną Poissona i że zamierzasz ją znormalizować, przyjmując log: . Ponieważ ma być normalne, planujesz dopasować standardowy model liniowy, dla którego lewą stroną jest . Ale ogólnie . W konsekwencji te dwa podejścia do modelowania są różne.Y ′ = log ( Y ) Y ′ E [ Y ′ | x ] = E [ log ( Y ) | x ] E [ log ( Y ) | x ] ≠ log ( E [ Y | x ] )Y Y′= log( Y) Y′ mi[ Y′| x]=E[ log( Y) | x ] mi[ log( Y) | x ] ≠ log( E[ Y| x])
źródło
Widzę dwie ważne różnice.
Po pierwsze, przewidywane wartości (w oryginalnej skali) zachowują się inaczej; w logicznych liniach najmniejszych kwadratów reprezentują warunkowe środki geometryczne; w modelu log-Poissona reprezentują środki warunkowe. Ponieważ dane w tego rodzaju analizach są często wypaczone w prawo, warunkowa średnia geometryczna nie docenia średniej warunkowej.
Drugą różnicą jest dorozumiany rozkład: lognormalny w porównaniu do Poissona. Odnosi się to do struktury heteroskedastyczności reszt: wariancja resztkowa proporcjonalna do kwadratowych wartości oczekiwanych (lognormalne) w porównaniu do wariancji resztkowej proporcjonalna do wartości oczekiwanej (Poissona).
źródło
Jedną oczywistą różnicą jest to, że regresja Poissona da liczby całkowite jako prognozy punktowe, podczas gdy regresja liniowa logarytmiczna może dać liczby całkowite.
źródło