Muszę przedstawić informacje o głównych predyktorach głosów kandydata na podstawie danych z badania opinii publicznej. Przeprowadziłem regresję logistyczną, używając wszystkich zmiennych, na których mi zależy, ale nie mogę znaleźć dobrego sposobu na przedstawienie tych informacji.
Mój klient nie dba tylko o wielkość efektu, ale o interakcję między wielkością efektu a wielkością populacji z takim atrybutem.
Jak sobie z tym poradzić na wykresie? Jakieś sugestie?
Oto przykład:
zmiennej płeć (mężczyzna = 1), gdy zmienna zależna jest oryginalne / nie w kandydata wynosi 2,3, co jest duża liczba po ustaniu potęgowania i traktowane jako iloraz szans lub prawdopodobieństwa. Jednak społeczeństwo, w którym przeprowadzono tę ankietę, miało tylko 30% mężczyzn. Dlatego chociaż człowiek dość mocno popierał tego kandydata, ich liczba jest nieznaczna dla kandydata próbującego wygrać wybory parlamentarne.
źródło
Odpowiedzi:
Zgadzam się z @PeterFlom, że przykład jest nieparzysty, ale odkładając na bok, zauważam, że zmienna objaśniająca jest kategoryczna. Jeśli jest to niezmiennie prawda, znacznie to upraszcza. Użyłbym mozaikowych wykresów, aby przedstawić te efekty. Wykres mozaikowy wyświetla proporcje warunkowe w pionie, ale szerokość każdej kategorii jest skalowana względem jej marginalnej (tj. Bezwarunkowej) proporcji w próbce.
Oto przykład z danymi z katastrofy Titanic, utworzonymi za pomocą R:
Po lewej stronie widzimy, że kobiety były znacznie bardziej narażone na przeżycie, ale mężczyźni stanowili około 80% ludzi na pokładzie. Tak więc zwiększenie odsetka ocalałych mężczyzn oznaczałoby uratowanie życia o wiele więcej niż nawet większy wzrost odsetka ocalałych kobiet. Jest to nieco analogiczne do twojego przykładu. Istnieje inny przykład po prawej stronie, w którym załoga i kierownictwo stanowiły największy odsetek ludzi, ale miały najniższe prawdopodobieństwo przeżycia. (Dla tego, co jest warte, nie jest to pełna analiza tych danych, ponieważ klasa i seks również nie były niezależne od Titanica, ale wystarczy zilustrować pomysły na to pytanie).
źródło
Jestem trochę ciekawy, jakie społeczeństwo ma tylko 10% mężczyzn ... ale ...
Jedną rzeczą, którą możesz zrobić, to wykreślić iloraz szans i oznaczyć każdą wielkością próbki.
Jeśli chcesz, aby obie zmienne były reprezentowane graficznie, możesz utworzyć wykres bąbelkowy, w którym położenie każdego bąbelka na osi y odpowiada rozmiarowi ilorazu szans, a obszar bąbelka jest proporcjonalny do wielkości próbki.
źródło