Co się stanie, gdy w regresji uwzględnię zmienną kwadratową?

Zaczynam od mojej regresji OLS: gdzie D jest zmienną fikcyjną, szacunki różnią się od zera niską wartością p. Następnie wykonuję test RESETU Ramseya i stwierdzam, że mam trochę błędnej specyfikacji równania, a zatem uwzględniam kwadrat x:

y = β_{0} + β_{1} x_{1} + β_{2} D + ε

$y = \beta _0 + \beta_1x_1+\beta_2 D + \varepsilon$

y = β_{0} + β_{1} x_{1} + β_{2} x_{1}^{2} + β_{3} D + ε

$y = \beta _0 + \beta_1x_1+\beta_2x_1^2+\beta_3 D + \varepsilon$

Co wyjaśnia kwadratowy termin? (Nieliniowy wzrost Y?)
W ten sposób moje oszacowanie D nie różni się już od zera, z wysoką wartością p. Jak interpretować kwadrat do kwadratu w moim równaniu (ogólnie)?

Edycja: poprawa pytania.

regression multiple-regression interpretation least-squares polynomial seini
źródło

możliwy duplikat Dlaczego wyniki ANOVA / Regresja zmieniają się podczas kontrolowania innej zmiennej

Makro

Prawdopodobny powód: i wydają się wyjaśniać tę samą zmienność w

x_{1}^{2}

$x_{1}^2$

D

$D$

y

$y$

steadyfish

Jedną rzeczą, która mogłaby pomóc, jest wyśrodkowanie przed utworzeniem kwadratu (patrz tutaj ). Jeśli chodzi o interpretację twojego kwadratu, twierdzę, że najlepiej jest interpretować jako całość (patrz tutaj ). Inną rzeczą jest to, że możesz potrzebować interakcji, co oznacza dodanie .

x

$x$

β_{1} x_{1} + β_{2} x_{1}^{2}

$\beta_1x_1+\beta_2x_1^2$

β_{4} x_{1} D + β_{5} x_{1}^{2} D

$\beta_4x_1D+\beta_5x_1^2D$

gung - Przywróć Monikę

Nie sądzę, żeby to naprawdę była kopia tego pytania; rozwiązanie jest inne (zmienne centrujące działają tutaj, ale nie tam, chyba że się mylę)

Peter Flom - Przywróć Monikę

@ Peter, interpretuję to pytanie jako podzbiór „Dlaczego dodam zmienną do mojego modelu, oszacowanie efektu / wartość dla niektórych innych zmian zmiennych?”, Które jest omówione w drugim pytaniu. Wśród odpowiedzi na te pytania są kolinearność (do której Gung nawiązuje w swojej odpowiedzi na to pytanie) / treść nakłada się między predyktorami (tj. Między a , co, jak podejrzewam, jest winowajcą w tym przypadku). Ta sama logika obowiązuje tutaj. Nie jestem pewien, co to za kontrowersja, ale w porządku, jeśli ty i inni nie zgadzacie się. Twoje zdrowie.

p

$p$

D

$D$

(x_{1}, x_{1}^{2})

$(x_1,x_1^2)$

Makro

Odpowiedzi:

Po pierwsze, zmienna fikcyjna jest interpretowana jako zmiana przechwytywania. Oznacza to, że twój współczynnik daje różnicę w przecięcia, gdy , tzn. Gdy , punkt przecięcia to . Ta interpretacja nie zmienia się po dodaniu kwadratu . $\beta_3$ $D=1$ $D=1$ $\beta_0 + \beta_3$ $x_1$

Teraz dodanie kwadratu do szeregu polega na założeniu, że relacja znika w pewnym momencie. Patrząc na twoje drugie równanie

y = β_{0} + β_{1} x_{1} + β_{2)} x_{1}^{2)} + β_{3)} re + ε

$y = \beta _0 + \beta_1x_1+\beta_2x_1^2+\beta_3 D + \varepsilon$

Biorąc pochodną wrt daje $x_1$

\frac{δ y}{δ x_{1}} = β_{1} + 2) β_{2)} x_{1}

$\frac{\delta y}{\delta x_1} = \beta_1 + 2\beta_2 x_1$

Rozwiązanie tego równania daje punkt zwrotny relacji. Jak wyjaśnił użytkownik1493368, rzeczywiście odzwierciedla to odwrotny kształt litery U, jeśli i odwrotnie. Weź następujący przykład: $\beta_1<0$

\hat{y} = 1.3 + 0,42 x_{1} - 0,32 x_{1}^{2)} + 0,14 re

$\hat{y} = 1.3 + 0.42 x_1 - 0.32 x_1^2 + 0.14D$

Pochodna wrt to $x_1$

\frac{δ y}{δ x_{1}} = 0,42 - 2) * 0,32 x_{1}

$\frac{\delta y}{\delta x_1} = 0.42 - 2*0.32 x_1$

Rozwiązanie dla daje ci $x_1$

\frac{δ y}{δ x_{1}} = 0 ⟺ x_{1} \approx 0.66

$\frac{\delta y}{\delta x_1} = 0 \iff x_1 \approx 0.66$

To jest punkt, w którym relacja ma swój punkt zwrotny. Możesz przyjrzeć się wynikowi Wolfram-Alpha dla powyższej funkcji, aby uzyskać wizualizację problemu.

Pamiętaj, interpretując efekt ceteris paribus zmiany na , musisz spojrzeć na równanie: $x_1$ $y$

Δ y = (β_{1} + 2 β_{2} x_{1}) Δ x

$\Delta y = (\beta_1 + 2\beta_2x_1)\Delta x$

Oznacza to, że nie można interpretować w izolacji, po dodaniu kwadratowego regresora ! $\beta_1$ $x_1^2$

Jeśli chodzi o twoje nieznaczne po uwzględnieniu kwadratu , wskazuje to na błąd błędnej specyfikacji. $D$ $x_1$

altabq
źródło

Cześć. Jeśli miałeś kilka predyktorów, powinieneś stosować pochodne częściowe lub pochodne ogółem (różne)?

skan

Częściowa pochodna jest nadal właściwą drogą do przejścia tutaj. Interpretacja wszystkich współczynników to ceteris paribus , tzn. Utrzymywanie wszystkiego innego na stałym poziomie. Właśnie to robisz, gdy bierzesz częściową pochodną.

altabq

Zobacz tę stronę UCLA IDRE, aby uzupełnić świetną odpowiedź @ altabq.

Cyrille

Dobry przykład włączenia kwadratu zmiennej pochodzi z ekonomii pracy. Jeśli przyjmiesz yjako wynagrodzenie (lub dziennik wynagrodzenia) i xjako wiek, wówczas uwzględnienie x^2oznacza, że testujesz kwadratową zależność między wiekiem a zarobkiem. Płaca rośnie wraz z wiekiem, gdy ludzie stają się bardziej doświadczeni, ale w wyższym wieku płaca zaczyna rosnąć w coraz mniejszym tempie (ludzie starzeją się i nie będą już tak zdrowi do pracy jak wcześniej), a w pewnym momencie płaca nie rośnie ( osiąga optymalny poziom płac), a następnie zaczyna spadać (przechodzą na emeryturę, a ich zarobki zaczynają maleć). Tak więc związek między płacą a wiekiem jest odwrócony w kształcie litery U (efekt cyklu życia). Ogólnie rzecz biorąc, dla wymienionego tutaj przykładu ageoczekuje się , że współczynnik on będzie dodatni i niż onage^2być negatywnym. Chodzi tutaj o to, że powinna istnieć podstawa teoretyczna / empiryczne uzasadnienie dla włączenia kwadratu zmiennej. Zmienną fikcyjną można tutaj uznać, że reprezentuje płeć pracownika. Możesz także dołączyć pojęcie interakcji płci i wieku, aby sprawdzić, czy różnica płci zależy od wieku.

Metryka
źródło