Muszę wyznać, że wcześniej nie słyszałem o tym terminie na żadnej z moich zajęć, na studiach licencjackich ani na studiach.
Co to znaczy, że regresja logistyczna jest Bayesowska? Szukam wyjaśnienia z przejściem od logistyki zwykłej do logistyki bayesowskiej podobnej do następującej:
Jest to równanie w modelu regresji liniowej: .
Jest to równanie w modelu regresji logistycznej: . Odbywa się to, gdy y jest kategoryczny.
To, co zrobiliśmy, to zmiana na .ln ( E ( y )
Co zatem zrobiono z modelem regresji logistycznej w bayesowskiej regresji logistycznej? Zgaduję, że to nie ma nic wspólnego z równaniem.
Ten podgląd książki wydaje się definiować, ale tak naprawdę nie rozumiem. Czym są te wszystkie wcześniejsze rzeczy dotyczące prawdopodobieństwa? Co to jest ? Czy ktoś mógłby wyjaśnić tę część książki lub model logitów bayesowskich w inny sposób?
Uwaga: Myślę, że zostało to już wcześniej zadane, ale nie zostało udzielone zbyt dobrej odpowiedzi.
Odpowiedzi:
Regresję logistyczną można opisać jako kombinację liniową
który jest przekazywany przez funkcję link :sol
gdzie funkcja link jest funkcją logowania
gdzie przyjmuje tylko wartości z { 0 , 1 }, a odwrotne funkcje logitowe przekształcają kombinację liniową η na ten zakres. Tu kończy się klasyczna regresja logistyczna.Y { 0 , 1 } η
Jeśli jednak przypomnisz sobie, że dla zmiennych, które przyjmują tylko wartości w { 0 , 1 } , to E ( Y | X , β ) można uznać za P ( Y = 1 | X , β ) . W takim przypadku dane wyjściowe funkcji logit można uznać za warunkowe prawdopodobieństwo „sukcesu”, tj. P ( Y = 1 | X ,mi( Y) = P( Y= 1 ) { 0 , 1 } mi( Y| X, β) P.( Y= 1 | X, β) . Rozkład Bernoulliegojest rozkładem opisującym prawdopodobieństwo zaobserwowania wyniku binarnego, z pewnymparametrem p , więc możemy opisać Y jakoP.( Y= 1 | X, β) p Y
Zatem przy regresji logistycznej szukamy niektórych parametrów które razem z niezależnymi zmiennymi X tworzą kombinację liniową η . W regresji klasycznej E ( Y | X , β ) = η (zakładamy, że funkcja link jest funkcją tożsamości), jednak w modelu Y, który przyjmuje wartości w { 0 , 1 } , musimy przekształcić η , aby dopasować [ 0 , 1 ] zasięg.β X η mi( Y| X, β) = η Y { 0 , 1 } η [ 0 , 1 ]
Teraz, aby oszacować regresję logistyczną w sposób bayesowski, wyłapujesz niektóre priorytety dla parametrów jak w przypadku regresji liniowej (patrz Kruschke i in., 2012 ), a następnie użyj funkcji logit do przekształcenia kombinacji liniowej η , aby użyć jej wyniku jako p parametr rozkładu Bernoulliego opisujący zmienną Y. Tak, tak, faktycznie używasz równania i funkcji logit w taki sam sposób, jak w przypadku częstotliwości, a reszta działa (np. Wybierając priory), podobnie jak szacowanie regresji liniowej metodą bayesowską.βja η p Y
Prostym podejściem do wyboru priorów jest wybranie rozkładów normalnych (ale możesz również użyć innych rozkładów, np. Rozkład - lub Laplace'a dla bardziej wytrzymałego modelu) dla β i z parametrami μ i i σ 2 i, które są ustawione lub wzięte z hierarchiczne priory . Teraz, mając definicję modelu, możesz użyć oprogramowania takiego jak JAGS, aby przeprowadzić symulację Markov Chain Monte Carlo , aby oszacować model. Poniżej kod pocztowy Jags dla prostego modelu logistycznego (sprawdź tutaj po więcej przykładów).t βja μja σ2)ja
Jak widać, kod bezpośrednio przekłada się na definicję modelu. Jakie oprogramowanie robi to rysuje pewne wartości z normalnego priors na
a
ib
, a następnie wykorzystuje te wartości do oszacowaniap
i wreszcie, wykorzystuje funkcję prawdopodobieństwa ocenić na ile prawdopodobne jest dane podane te parametry (to jest, gdy używasz Twierdzenie Bayesa, patrz tutaj dla bardziej szczegółowy opis).Podstawowy model regresji logistycznej można rozszerzyć w celu modelowania zależności między predyktorami przy użyciu modelu hierarchicznego (w tym hiperpriorów ). W takim przypadku możesz narysować z wielowymiarowego rozkładu normalnego, który pozwala nam zawrzeć informację o kowariancji Σ między zmiennymi niezależnymiβja Σ
... ale chodzi tu o szczegóły, więc zatrzymajmy się tutaj.
Część „bayesowska” tutaj wybiera priorytety, używając twierdzenia Bayesa i definiując model w kategoriach probabilistycznych. Zobacz tutaj definicję „modelu bayesowskiego”, a tutaj ogólną intuicję dotyczącą podejścia bayesowskiego . Można także zauważyć, że dzięki temu podejściu definiowanie modeli jest dość proste i elastyczne.
Kruschke, JK, Aguinis, H., i Joo, H. (2012). Nadszedł czas: Bayesowskie metody analizy danych w naukach organizacyjnych. Metody badań organizacyjnych, 15 (4), 722-752.
Gelman, A., Jakulin, A., Pittau, GM, i Su, Y.-S. (2008). Słabo informacyjna domyślna wcześniejsza dystrybucja modeli logistycznych i innych modeli regresji. The Annals of Applied Statistics, 2 (4), 1360–1383.
źródło
Właśnie dlatego Bayesian. Generatywny model danych jest taki sam; różnica polega na tym, że analiza bayesowska wybiera wcześniejszy rozkład parametrów będących przedmiotem zainteresowania i oblicza lub aproksymuje rozkład tylny , na którym opiera się wszystkie wnioski. Zasada Bayesa odnosi się do dwóch: Tylna część ciała jest proporcjonalna do czasów prawdopodobieństwa wcześniejszych.
Niektóre modele częstych mogą być powiązane z odpowiednikiem bayesowskim z konkretnym przeorem, choć nie jestem pewien, co odpowiada w tym przypadku.
źródło