Weźmy i i załóżmy, że modelujemy zadanie przewidywania y dla x za pomocą regresji logistycznej. Kiedy współczynniki regresji logistycznej można zapisać w formie zamkniętej?
Jednym z przykładów jest użycie modelu nasyconego.
To znaczy zdefiniuj , gdzie indeksuje zestawy w zestawie mocy , a zwraca 1, jeśli wszystkie zmienne w -tym zestawie to 1, a w przeciwnym razie 0. Następnie możesz wyrazić każde w tym modelu regresji logistycznej jako logarytm racjonalnej funkcji statystyki danych.i { x 1 , … , x d } f i i w i
Czy istnieją inne ciekawe przykłady, gdy istnieje zamknięty formularz?
logistic
generalized-linear-model
Jarosław Bułatow
źródło
źródło
Odpowiedzi:
Jak zauważył kjetil b halvorsen, na swój sposób cudem jest regresja liniowa dopuszczająca rozwiązanie analityczne. A dzieje się tak tylko dzięki liniowości problemu (w odniesieniu do parametrów). W OLS masz który ma warunki pierwszego rzędu - 2 ∑ i ( y i - x ′ i β ) x i = 0 W przypadku problemu z p
Teraz, dzięki regresji logistycznej, rzeczy nie są już takie proste. Zapisując funkcję log-wiarygodności, a przy jego pochodna znaleźć MLE, mamy ∂ l
Nieco głębsze spojrzenie na problem (biorąc pod uwagę drugą pochodną) pokazuje, że jest to wypukły problem optymalizacji znalezienia maksimum funkcji wklęsłej (gloryfikowana parabola wielowymiarowa), więc jedno z nich istnieje i każdy rozsądny algorytm powinien go znaleźć szybko, albo wszystko wyleci w nieskończoność. To ostatnie dzieje się z regresją logistyczną, gdy dla niektórych cP r o b [ Yja= 1 | x′jaβ> c ] = 1 do , tj. masz doskonałą prognozę. Jest to raczej nieprzyjemny artefakt: można by pomyśleć, że gdy masz doskonałą prognozę, model działa doskonale, ale co ciekawe, jest odwrotnie.
źródło
Ten post pierwotnie miał być długim komentarzem, a nie pełną odpowiedzią na pytanie.
Z pytania wynika, że nieco niejasne jest, czy interes leży tylko w przypadku binarnym, a może w bardziej ogólnych przypadkach, w których mogą być ciągłe lub przyjmować inne dyskretne wartości.
Jeden przykład, który nie do końca odpowiada na pytanie, ale jest powiązany i który podoba mi się, dotyczy rankingów preferencji pozycji uzyskanych za pomocą porównań w parach. Model Bradleya-Terry'ego można wyrazić jako regresję logistyczną, w której
Jeśli przeprowadzane jest pełne porównywanie okrężne (tzn. Dla każdego nieuporządkowanego rejestrowana jest preferencja parowa( i , j ) α^ja S.ja= ∑j ≠ iYI j
Aby to zinterpretować, wyobraź sobie pełny turniej typu round-robin w ulubionym sporcie wyczynowym. Następnie wynik ten mówi, że model Bradleya-Terry'ego uszeregowuje graczy / drużyny według ich procentu wygranych. To, czy jest to wynik zachęcający, czy rozczarowujący, zależy od twojego punktu widzenia.
Uwaga: Ten wynik w kolejności szeregowania nie obowiązuje na ogół, gdy nie jest odtwarzany pełny runda.
źródło