Jaka jest różnica statystyczna między regresją liniową w R z formula
ustawieniem na y ~ x + 0
zamiast y ~ x
? Jak interpretować te dwa różne wyniki?
11
Jaka jest różnica statystyczna między regresją liniową w R z formula
ustawieniem na y ~ x + 0
zamiast y ~ x
? Jak interpretować te dwa różne wyniki?
Dodanie +0
(lub -1
) do formuły modelu (np. In lm()
) w R tłumi przecięcie. Jest to ogólnie uważane za złe; widzieć:
Oszacowane nachylenie jest obliczane różnie w zależności od tego, czy oszacowany jest również punkt przecięcia, a mianowicie:
Ponieważ ilość do odjęcia („subtrahend”) zarówno w liczniku, jak i mianowniku niekoniecznie wynosi , oszacowanie nachylenia jest tendencyjne, gdy punkt przecięcia jest tłumiony.
Wartość jest także obliczana inaczej; widzieć:
Oto podstawowe formuły:
Zależy to od kontekstu (oczywiście), w
lm(...)
poleceniu w R tłumi przechwytywanie. Oznacza to, że regresujesz mimo pochodzenia.Zauważ, że większość podręczników na temat regresji powie ci, że wymuszanie przechwytywania (do dowolnej wartości) jest złym pomysłem.
Interpretacja x nie zmienia się, ale wartość (w porównaniu z i bez przecięcia) zmieni się, czasem bardzo znacząco.
źródło