Czy ktoś wie, jak sprawdzić, czy punkty 7, 16 i 29 są punktami wpływowymi, czy nie? Czytałem gdzieś, że ponieważ odległość Cooka jest mniejsza niż 1, nie są. Czy mam rację?
r
regression
residuals
diagnostic
cooks-distance
Platypezid
źródło
źródło
Odpowiedzi:
Niektóre teksty mówią, że punkty, dla których odległość Cooka jest większa niż 1, należy uznać za wpływowe. Inne teksty podają próg lub 4 / ( N - k - 1 ) , gdzie N jest liczbą obserwacji, a k liczbą zmiennych objaśniających. W twoim przypadku ta druga formuła powinna dawać próg około 0,1.4 / N 4 / ( N- k - 1 ) N. k
John Fox (1) w swojej broszurze na temat diagnostyki regresji jest dość ostrożny, jeśli chodzi o podawanie progów liczbowych. Zaleca użycie grafiki i dokładniejsze zbadanie punktów z „wartościami D, które są znacznie większe niż reszta”. Według Foxa progi powinny być po prostu stosowane do ulepszania wyświetlania graficznego.
W twoim przypadku obserwacje 7 i 16 można uznać za wpływowe. Cóż, przynajmniej przyjrzałbym się im z bliska. Obserwacja 29 nie różni się zasadniczo od kilku innych obserwacji.
(1) Fox, John. (1991). Diagnostyka regresji: wprowadzenie . Publikacje Sage.
źródło
Warto tutaj wspomnieć o jeszcze jednym. W badaniach obserwacyjnych często trudno jest równomiernie próbkować w przestrzeni predyktora, a może być tylko kilka punktów w danym obszarze. Takie punkty mogą różnić się od reszty. Posiadanie kilku odrębnych przypadków może być nieprzyjemne, ale zasługują na głęboką refleksję, zanim zostaną zdegradowane. Pomiędzy predyktorami może istnieć interakcja lub system może zmienić się, by zachowywać się inaczej, gdy wartości predyktorów staną się ekstremalne. Ponadto mogą pomóc w rozwiązaniu skutków predyktorów kolinearnych. Punkty wpływowe mogą być przebłagalnym błogosławieństwem.
źródło