Pracujemy z pewnymi regresjami logistycznymi i zdaliśmy sobie sprawę, że średnie oszacowane prawdopodobieństwo zawsze równa jest proporcji jednych w próbie; to znaczy, średnia dopasowanych wartości jest równa średniej próbki.
Czy ktoś może mi wyjaśnić przyczynę lub podać źródło, w którym mogę znaleźć tę demonstrację?
Odpowiedzi:
Obserwowane zachowanie jest „typowym” przypadkiem regresji logistycznej, ale nie zawsze jest prawdą. Ma również znacznie większą ogólność (patrz poniżej). Jest to konsekwencja zbiegu trzech odrębnych faktów.
Jeśli którekolwiek z powyższych nie występuje, wówczas średnie oszacowane prawdopodobieństwa nie będą na ogół odpowiadały odsetkowi prawdopodobieństw w próbie.
Jednak (prawie) wszyscy oprogramowanie statystyczne wykorzystuje oszacowanie maksymalnego prawdopodobieństwa dla takich modeli, więc w praktyce pozycje 1 i 2 są zasadniczo zawsze obecne, a pozycja 3 jest zwykle obecna, z wyjątkiem szczególnych przypadków.
Trochę szczegółów
W typowych ramach regresji logistycznej obserwujemy wyniki niezależnych prób dwumianowych z prawdopodobieństwem . Niech Y i być obserwowane reakcje. Następnie całkowite prawdopodobieństwo, L = n Π i = 1 p r ı I ( 1 - p ı ) 1 - Y i = n Π i = 1 exp ( y i log ( p ı / ( 1 - p Ipja yja
A więc Log-Likelihood jest
ℓ = n Σ i = 1 Y i log ( s I / ( 1 - P i ) ) + n Σ i = 1 log ( 1 - P I )
Teraz mamy wektor predyktorów dla każdej obserwacji, a z faktu 1 powyżej model regresji logistycznej zakłada, że log p ixja
Korzystając z faktu 3, jeślixja ma składnik jot to zawsze 1 na każdy ja , następnie ∑jayjaxI j= ∑jayja= ∑jap^ja i dlatego empiryczna proporcja pozytywnych odpowiedzi odpowiada średniej dopasowanych prawdopodobieństw.
Symulacja
Włączenie przechwytywania jest ważne. Oto przykład wR w celu wykazania, że obserwowane zachowanie może nie wystąpić, gdy w modelu nie ma żadnego przechwytywania.
Przypadek ogólny : jak wspomniano powyżej, właściwość, że średnia odpowiedź jest równa średniej przewidywanej średniej, ma znacznie większą ogólność dla klasy uogólnionych modeli liniowych pasujących z najwyższym prawdopodobieństwem, przy użyciu funkcji łącza kanonicznego i uwzględnienia przecięcia w Model.
Bibliografia
Niektóre dobre odniesienia do powiązanej teorii są następujące.
źródło