Próbuję dopasować model wielokrotnej regresji liniowej do moich danych za pomocą kilku parametrów wejściowych, powiedzmy 3.
Jak wyjaśnić i zwizualizować ten model? Mógłbym wymyślić następujące opcje:
Wymień równanie regresji opisane w (współczynniki, stała) wraz ze standardowym odchyleniem, a następnie wykres błędu resztkowego, aby pokazać dokładność tego modelu.
Wykresy par niezależnych i zależnych zmiennych, takie jak to:
Po poznaniu współczynników punkty danych wykorzystane do otrzymania równania można skondensować do ich wartości rzeczywistych. Oznacza to, że dane treningowe mają nowe wartości, w postaci zamiast , , , gdzie każda z niezależnych zmiennych jest mnożona przez odpowiedni współczynnik. Następnie tę uproszczoną wersję można wizualnie przedstawić jako prostą regresję, jak to:
Jestem zmieszany tym, pomimo przejrzenia odpowiednich materiałów na ten temat. Czy ktoś może mi wyjaśnić, jak „wyjaśnić” model wielokrotnej regresji liniowej i jak go wizualnie pokazać.
Odpowiedzi:
Moim ulubionym sposobem pokazania wyników podstawowej wielokrotnej regresji liniowej jest najpierw dopasowanie modelu do znormalizowanych (ciągłych) zmiennych. Oznacza to, że transformacja z s przez odjęcie średniej i podzielenie przez odchylenie standardowe, a następnie dopasować model i estymacji parametrów. Gdy zmienne są przekształcane w ten sposób, szacowane współczynniki są „standaryzowane”, aby uzyskać jednostkę . W ten sposób odległość współczynników od zera szereguje ich względną „ważność”, a ich CI daje precyzję. Myślę, że dość dobrze podsumowuje relacje i oferuje znacznie więcej informacji niż współczynniki i wartości p. W ich naturalnych i często odmiennych skalach liczbowych. Przykład jest poniżej:X Δ Y/ Δsd( X)
EDYCJA: Inną możliwością jest użycie „dodanego wykresu zmiennej” (tj. Wykres częściowych regresji). Daje to inną perspektywę, ponieważ pokazuje zależności dwuwymiarowe między i PO UZNAWANIU INNYCH ZMIENNYCH. Na przykład częściowe regresje dałyby dwuwymiarowe relacje między stosunku do reszt po regresji względem pozostałych dwóch warunków. Zrobiłbyś to dla każdej zmiennej. Funkcja z biblioteki daje te wykresy z dopasowanego obiektu. Przykład jest poniżej:Y Xja Y∼ X1+ X2)+ X3) Xja Y
avPlots()
car
lm
źródło
Ponieważ wszystkie one mają związek z wyjaśnieniem przyczyn marskości wątroby, czy próbowałeś zrobić wykres bąbelkowy / kołowy i użyć koloru, aby wskazać różne regresory i promień koła, aby wskazać względny wpływ na marskość wątroby?
Mam na myśli typ wykresu Google, który wygląda następująco:
I na niepowiązany temat, chyba że źle czytam twoje fabuły, myślę, że masz tam trochę zbędnych regresorów. Wino jest już alkoholem, więc jeśli te dwa są osobnymi regresorami, nie ma sensu trzymać ich obu, jeśli Twoim celem jest wyjaśnienie występowania marskości wątroby.
źródło