Regresja logistyczna vs chi-kwadrat w tablicach kontyngencji 2x2 i Ix2 (pojedynczy czynnik - odpowiedź binarna)?

10

Próbuję zrozumieć zastosowanie regresji logistycznej w tabelach awaryjnych 2x2 i Ix2. Na przykład, używając tego jako przykładu

wprowadź opis zdjęcia tutaj

Jaka jest różnica między użyciem testu chi-kwadrat a użyciem regresji logistycznej? Co z tabelą z wieloma współczynnikami nominalnymi (tabela Ix2) w następujący sposób:

wprowadź opis zdjęcia tutaj

Jest to podobne pytanie tutaj - ale odpowiedź jest głównie że chi-kwadrat może obsługiwać tabele MXN, ale moje pytanie brzmi: co jest specificalyl do kiedy jest binarny wynik i pojedynczy czynnik nominalna. (Połączony wątek odnosi się również do tego wątku , ale dotyczy to wielu zmiennych / czynników).

Jeśli jest to tylko jeden czynnik (tj. Nie ma potrzeby kontrolowania innych zmiennych) z odpowiedzią binarną, jaka jest różnica w celu wykonania regresji logistycznej?

P Xandor
źródło
+1 dla pytania, ale musisz ułatwić kopiowanie i wklejanie danych, aby z nim pracować.
Antoni Parellada,
2
Zobacz Dlaczego moje wartości p różnią się między wynikami regresji logistycznej, testem chi-kwadrat i przedziałem ufności dla OR? . Test chi-kwadrat Pearsona na asocjację jest tylko testem punktowym dla hipotezy zerowej, że wszystkie zbocza są zerowe. Odpowiedni test współczynnika wiarygodności jest asymptotycznie równoważny. Jak mówi @Kodiologist, zastosowania, do których można zastosować regresję logistyczną, są szersze niż testowanie, czy wszystkie nachylenia są zerowe.
Scortchi - Przywróć Monikę

Odpowiedzi:

12

Ostatecznie to jabłka i pomarańcze.

Regresja logistyczna jest sposobem modelowania zmiennej nominalnej jako probabilistycznego wyniku jednej lub więcej innych zmiennych. Po dopasowaniu modelu regresji logistycznej można by sprawdzić, czy współczynniki modelu znacznie różnią się od 0, obliczając przedziały ufności dla współczynników lub sprawdzając, jak dobrze model może przewidzieć nowe obserwacje.

Test χ² niezależności jest specyficzny test istotności, która testuje hipotezy zerowej, że dwie zmienne nominalne są niezależne.

To, czy należy zastosować regresję logistyczną, czy test χ², zależy od pytania, na które chcesz odpowiedzieć. Na przykład test χ² może sprawdzić, czy nieuzasadnione jest przekonanie, że zarejestrowana partia polityczna danej osoby jest niezależna od jej rasy, podczas gdy regresja logistyczna może obliczyć prawdopodobieństwo, że dana osoba z danej rasy, wieku i płci należy do każdej partii politycznej .

Kodiolog
źródło
Dzięki. Czy byłbyś w stanie podać przykład różnego rodzaju pytań, na które możesz odpowiedzieć różnymi metodami? Czy są jakieś konkretne zasoby, które możesz polecić, aby zrozumieć różne pytania, na które można odpowiedzieć dwiema metodami?
L Xandor,
Dodałem przykłady do mojej odpowiedzi. Jeśli chodzi o twoje drugie pytanie, Wikipedia to dobre miejsce na początek. Ponadto większość wprowadzających podręczników statystyki statystycznej będzie zawierać zarówno test niezależności χ², jak i regresję logistyczną.
Kodiolog,
Dzięki. Nadal nie jestem pewien, jaka jest różnica w konkretnym przypadku tabeli przypadków 2x2? chi kwadrat sprawdziłby, czy wynik jest niezależny od zmian czynnika, ale co tutaj robi regresja logistyczna? Rozumiem, że LR jest przydatny do wykonywania prognoz opartych na szeregu czynników, ale jeśli chodzi o proste 2x2, nie jestem pewien, jaka jest różnica (ale jest wyraźnie używana) ... czy mógłbyś (lub ktokolwiek) użyć 2x2 tabela stresu / powrotu w oryginalnym poście jako konkretny przykład, w jaki sposób byłyby one używane inaczej? Najbardziej interesuje mnie przypadek
jednoskładnikowy
lub partia / partia polityczna działa równie dobrze jak przykład, ale kiedy używasz regresji logistycznej, używasz wielu czynników, i widzę, jak jest tam przydatna ... ale szczególnie trudno mi zrozumieć, dlaczego użyj LR (lub jak to się różni) w przypadku pojedynczego czynnika. Jeśli obie metody są stosowane do badania relacji między rasą a partią polityczną, jaka jest różnica między kwadratem chi a regresją logistyczną?
L Xandor,
W przypadku stresu i refluksu można użyć regresji logistycznej, aby sprawdzić, czy stres znacząco wpływa na prawdopodobieństwo refluksu, lub obliczyć przedział ufności dla ilorazu szans wyrażającego ten efekt. Jednym ze sposobów, w jaki jest to koncepcyjnie różne od testu χ², jest to, że jeden z naprężeń lub refluksu jest interpretowany jako zmienna zależna. W każdym razie regresję logistyczną można uznać za przesadę w tabeli awaryjnej 2 na 2.
Kodiolog