Próbuję zrozumieć zastosowanie regresji logistycznej w tabelach awaryjnych 2x2 i Ix2. Na przykład, używając tego jako przykładu
Jaka jest różnica między użyciem testu chi-kwadrat a użyciem regresji logistycznej? Co z tabelą z wieloma współczynnikami nominalnymi (tabela Ix2) w następujący sposób:
Jest to podobne pytanie tutaj - ale odpowiedź jest głównie że chi-kwadrat może obsługiwać tabele MXN, ale moje pytanie brzmi: co jest specificalyl do kiedy jest binarny wynik i pojedynczy czynnik nominalna. (Połączony wątek odnosi się również do tego wątku , ale dotyczy to wielu zmiennych / czynników).
Jeśli jest to tylko jeden czynnik (tj. Nie ma potrzeby kontrolowania innych zmiennych) z odpowiedzią binarną, jaka jest różnica w celu wykonania regresji logistycznej?
źródło
Odpowiedzi:
Ostatecznie to jabłka i pomarańcze.
Regresja logistyczna jest sposobem modelowania zmiennej nominalnej jako probabilistycznego wyniku jednej lub więcej innych zmiennych. Po dopasowaniu modelu regresji logistycznej można by sprawdzić, czy współczynniki modelu znacznie różnią się od 0, obliczając przedziały ufności dla współczynników lub sprawdzając, jak dobrze model może przewidzieć nowe obserwacje.
Test χ² niezależności jest specyficzny test istotności, która testuje hipotezy zerowej, że dwie zmienne nominalne są niezależne.
To, czy należy zastosować regresję logistyczną, czy test χ², zależy od pytania, na które chcesz odpowiedzieć. Na przykład test χ² może sprawdzić, czy nieuzasadnione jest przekonanie, że zarejestrowana partia polityczna danej osoby jest niezależna od jej rasy, podczas gdy regresja logistyczna może obliczyć prawdopodobieństwo, że dana osoba z danej rasy, wieku i płci należy do każdej partii politycznej .
źródło