Obecnie oceniam wielokoliniowość w moich zestawach danych.
Jakie wartości progowe VIF i wskaźnika stanu poniżej / powyżej sugerują problem?
VIF: Słyszałem, że VIF jest problemem.
Po usunięciu dwóch zmiennych problemowych VIF wynosi dla każdej zmiennej. Czy zmienne wymagają dalszego leczenia, czy też ten VIF wydaje się w porządku?
Indeks stanów : Słyszałem, że indeks stanów (CI) wynoszący 30 lub więcej stanowi problem. Moje najwyższe CI wynosi 16,66. Czy to problem?
Inne sprawy:
- Czy są jakieś inne dos / donts, które należy wziąć pod uwagę?
- Czy są jeszcze inne rzeczy, o których muszę pamiętać?
multiple-regression
linear-model
multicollinearity
vif
ayush biyani
źródło
źródło
Odpowiedzi:
Problem wielokoliniowości jest dobrze zbadany w większości podręczników ekonometrycznych. Ponadto w Wikipedii znajduje się dobry artykuł, który podsumowuje większość kluczowych zagadnień.
prawdopodobnie nie teoretycznie, ponieważ może się zdarzyć (i zwykle tak jest), że wszystkie zmienne są obecne w modelu. Wykluczenie odpowiednich zmiennych (problem zmiennej pominiętej) spowoduje i tak tendencyjne i niespójne oszacowanie parametrów. Z drugiej strony możesz zostać zmuszony do włączenia wszystkich zmiennych fokusowych tylko dlatego, że twoja analiza jest na ich podstawie. W podejściu do eksploracji danych jesteś jednak bardziej techniczny w poszukiwaniu najlepszego dopasowania.
Pamiętaj więc o alternatywach (z których skorzystałbym sam):
Niektóre inne sztuczki znajdują się w wyżej wspomnianym artykule na wiki.
źródło
Uważam, że Belsely powiedział, że CI powyżej 10 wskazuje na możliwy umiarkowany problem, podczas gdy powyżej 30 jest poważniejszy.
Ponadto należy jednak przyjrzeć się wariancji dzielonej przez zestawy zmiennych we wskaźnikach wysokiego warunku. Toczy się debata (lub była, kiedy ostatnio czytałem tę literaturę) na temat tego, czy kolinearność, która dotyczyła jednej zmiennej i przechwytywania, była problematyczna, czy też nie, i czy wyśrodkowanie zmiennej przestępczej pozbyło się problemu, czy po prostu przeniosło go gdzie indziej.
źródło