Chcę wykryć, czy kolinearność jest problemem w mojej regresji OLS. Rozumiem, że czynniki inflacyjne wariancji i wskaźnik warunków są dwiema powszechnie stosowanymi miarami, ale trudno mi znaleźć coś konkretnego na podstawie zalet każdego podejścia lub tego, jakie powinny być wyniki.
Bardzo przydatne byłoby wybitne źródło, które wskazuje, jakie podejście należy zastosować i / lub jakie wyniki są odpowiednie.
Podobne pytanie zostało zadane w „Czy istnieje powód, aby preferować określoną miarę wielokoliniowości?” ale idealnie jestem po referencji, którą mogę zacytować.
Odpowiedzi:
Belsley, Krowa i Welsch jest tekst, aby przejść do tego rodzaju kwestii. Obejmują one obszerne omówienie starszej diagnostyki w części zatytułowanej „Perspektywa historyczna”. Piszą o VIF
Ostatecznie BKW zaleca zdiagnozowanie kolinearności za pomocą
źródło
Jednak VIF jak zwykle implementowane nie mogą powiedzieć o kolinearności z przechwytywaniem, ponieważ przechwytywanie jest zwykle dyskretnie zawarte w tych regresjach „pomocniczych”. Ponadto, jeśli regresor ma wysokie VIF, nie od razu wiadomo, które inne regresory są odpowiedzialne za kolinearność. Trzeba spojrzeć na znormalizowane współczynniki w regresjach pomocnika.
Wskaźniki stanu i proporcje rozkładu kolinearności Belsleya, Kuha i Welscha (Belsley, DA; Kuh, E. i Welscha, RE Regression Diagnostics: Identyfikacja wpływowych danych i źródeł kolinearności. John Wiley & Sons, 1980) są znacznie trudniejsze do zrozumienia. Pracowałem z nimi kilka lat temu, ale nie będę próbował ich tutaj wyjaśniać bez odświeżenia ;-)
Te diagnostyka nie umożliwiają wykrywanie kolinearność z osią. I możesz zbadać proporcje rozkładu kolinearności, aby wywnioskować, które inne regresory są odpowiedzialne za kolinearność jednego regresora.
źródło
W przypadku szeroko dostępnych odniesień do cytowania książka Faraway na stronie 117 zawiera ogólną regułę powyżej 30 do wykrywania problemów na podstawie numerów warunków, a Wstęp do nauki statystycznej , strona 101, mówi, że wartości VIF powyżej 5 lub 10 wskazują na problem .
Prawdopodobnie ważniejsza niż metoda identyfikacji wielokoliniowości będzie sposób jej obsługi.
źródło