Mam następującą funkcję prawdopodobieństwa:
gdzie
Mój model wygląda
Jest to wizualizowane za pomocą krzywej prawdopodobieństwa, która wygląda jak ta poniżej.
Zastanawiam się nad dodaniem kilku zmiennych do mojego pierwotnego równania regresji. Załóżmy, że dodam do modelu płeć (kategorycznie: F i M) i wiek (kategorycznie: <25 i> 26), a ja otrzymuję:
W RI można wygenerować podobną krzywą prawdopodobieństwa, która powie mi prawdopodobieństwo Y = 1 przy uwzględnieniu wszystkich trzech predyktorów. Zgubiłem się, chcę znaleźć prawdopodobieństwa dla każdej możliwej permutacji tych odmian.
Kiedy więc stawka = 1, płeć = M, a wiek wynosi> = 26, jakie jest prawdopodobieństwo, że Y = 1? Podobnie, gdy stawka = 2, płeć = F, a wiek wynosi> = 26, jakie jest prawdopodobieństwo, że Y = 1?
Chcę wygenerować krzywą prawdopodobieństwa, która pozwoli mi to zwizualizować.
Czy ktoś może pomóc? Być może zupełnie nie rozumiem, jakie informacje można uzyskać z modelu logit, ale proszę powiedz mi, czy również nie rozumiem teorii.
źródło
Predict()
i,plot.Predict()
aby dowiedzieć się, co można zrobić (obejmuje to wykreślenie jako funkcji , z ustawionymi na wartości domyślne, lub wybrane wartości stałe).Odpowiedzi:
Na szczęście dla ciebie masz tylko jedną ciągłą zmienną towarzyszącą. W ten sposób można po prostu wykonać cztery (tj. 2 SEX x 2 WIEK) wykresy, każda z zależnością między BID . Alternatywnie, możesz utworzyć jeden wykres z czterema różnymi liniami (możesz użyć różnych stylów linii, grubości lub kolorów, aby je rozróżnić). Możesz uzyskać te przewidywane linie, rozwiązując równanie regresji dla każdej z czterech kombinacji dla zakresu wartości BID.p(Y=1)
Bardziej skomplikowana sytuacja ma miejsce, gdy masz więcej niż jedną ciągłą zmienną towarzyszącą. W takim przypadku często występuje szczególna zmienna towarzysząca, która w pewnym sensie jest „pierwotna”. Zmianę tę można zastosować dla osi X. Następnie rozwiązujesz dla kilku wcześniej określonych wartości innych zmiennych towarzyszących, zwykle średniej i +/- 1SD. Inne opcje obejmują różne typy wykresów 3D, coplot lub interaktywnych.
Moja odpowiedź na inne pytanie tutaj zawiera informacje na temat szeregu wykresów do eksploracji danych w więcej niż 2 wymiarach. Twój przypadek jest zasadniczo analogiczny, z wyjątkiem tego, że jesteś zainteresowany przedstawieniem przewidywanych wartości modelu, a nie wartości surowych.
Aktualizacja:
Napisałem prosty kod przykładowy w R, aby wykonać te wykresy. Pragnę zwrócić uwagę na kilka rzeczy: ponieważ „akcja” ma miejsce wcześnie, uruchomiłem BID tylko przez 700 (ale mogę przedłużyć to do 2000). W tym przykładzie używam podanej funkcji i biorę pierwszą kategorię (tj. Kobietę i młodą kobietę) jako kategorię referencyjną (która jest domyślna w R). Jak zauważa @whuber w swoim komentarzu, Modele LR są liniowe w logarytmicznych szansach, więc możesz użyć pierwszego bloku przewidywanych wartości i wykreślić, jak możesz z regresją OLS, jeśli wybierzesz. Logit to funkcja łącza, która pozwala połączyć model z prawdopodobieństwami; drugi blok przekształca logarytmiczne szanse na prawdopodobieństwa poprzez odwrotność funkcji logit, to znaczy przez wykładnik (przekształcenie w iloraz szans), a następnie podzielenie szans przez 1 + szansę. (Omówię charakter funkcji łącza i tego typu modelu tutaj , jeśli chcesz uzyskać więcej informacji).
Co daje następujący wykres:
Funkcje te są wystarczająco podobne, że czterobiegunowe podejście do wykresu, które przedstawiłem na początku, nie jest bardzo charakterystyczne. Poniższy kod implementuje moje „alternatywne” podejście:
produkując z kolei fabułę:
źródło