Co faktycznie oblicza wzór y ~ x + 0 w R?

Odpowiedzi:

18

Dodanie +0(lub -1) do formuły modelu (np. In lm()) w R tłumi przecięcie. Jest to ogólnie uważane za złe; widzieć:

Oszacowane nachylenie jest obliczane różnie w zależności od tego, czy oszacowany jest również punkt przecięcia, a mianowicie:

(with intercept)β^1=xiyi(xi)(yi)Nxi2(xi)2N(without intercept)β^1=xiyixi2

Ponieważ ilość do odjęcia („subtrahend”) zarówno w liczniku, jak i mianowniku niekoniecznie wynosi , oszacowanie nachylenia jest tendencyjne, gdy punkt przecięcia jest tłumiony. 0

Wartość jest także obliczana inaczej; widzieć: R2

Oto podstawowe formuły:

(with intercept)R2=1(yiy^i)2(yiy¯)2(without intercept)R2=1(yiy^i)2yi2
gung - Przywróć Monikę
źródło
Dziękuję, gung! Jeśli stłumię przechwytywanie, moja wielokrotność kwadratu R poprawi się nagle. Czy możesz mi pomóc tutaj?
JimBoy,
6
Nie ma uzgodnionego sposobu obliczania r do kwadratu bez przecięcia. Kwadrat r nie ma swojej zwykłej interpretacji. Robienie regresji bez przechwytywania jest prawie zawsze BARDZO złym pomysłem
Repmat
5

Zależy to od kontekstu (oczywiście), w lm(...)poleceniu w R tłumi przechwytywanie. Oznacza to, że regresujesz mimo pochodzenia.

Zauważ, że większość podręczników na temat regresji powie ci, że wymuszanie przechwytywania (do dowolnej wartości) jest złym pomysłem.

Interpretacja x nie zmienia się, ale wartość (w porównaniu z i bez przecięcia) zmieni się, czasem bardzo znacząco.

Repmat
źródło
Dziękuję, Repmat! Otrzymuję bardzo różne oszacowania, jeśli pomijam przechwytywanie w porównaniu do tego, kiedy nie. Ponadto wszystkie testy t stają się bardzo znaczące. Czy wiesz dlaczego tak jest?
JimBoy
2
Punkt przecięcia pochłonie wszelkie zmienne inne niż 0, które nie są zawarte w modelu. Po zniknięciu przechwytywania wariancja musi gdzieś pójść. Dlatego większość książek z reguły stwierdza, że ​​regresja bez przechwytywania jest zawsze błędna. Oznacza to, że OLS jest zawsze stronniczy i spójny w tym przypadku (z kilkoma wyjątkami).
Repmat,