Co się stanie, gdy w regresji uwzględnię zmienną kwadratową?

20

Zaczynam od mojej regresji OLS: gdzie D jest zmienną fikcyjną, szacunki różnią się od zera niską wartością p. Następnie wykonuję test RESETU Ramseya i stwierdzam, że mam trochę błędnej specyfikacji równania, a zatem uwzględniam kwadrat x: y = β 0 + β 1 x 1 + β 2 x 2 1 + β 3 D + ε

y=β0+β1x1+β2D+ε
y=β0+β1x1+β2x12+β3D+ε
  1. Co wyjaśnia kwadratowy termin? (Nieliniowy wzrost Y?)
  2. W ten sposób moje oszacowanie D nie różni się już od zera, z wysoką wartością p. Jak interpretować kwadrat do kwadratu w moim równaniu (ogólnie)?

Edycja: poprawa pytania.

seini
źródło
1
Prawdopodobny powód: i wydają się wyjaśniać tę samą zmienność w D yx12Dy
steadyfish
3
Jedną rzeczą, która mogłaby pomóc, jest wyśrodkowanie przed utworzeniem kwadratu (patrz tutaj ). Jeśli chodzi o interpretację twojego kwadratu, twierdzę, że najlepiej jest interpretować jako całość (patrz tutaj ). Inną rzeczą jest to, że możesz potrzebować interakcji, co oznacza dodanie . x β1x1+β2x12 β4x1D+β5x12D
gung - Przywróć Monikę
Nie sądzę, żeby to naprawdę była kopia tego pytania; rozwiązanie jest inne (zmienne centrujące działają tutaj, ale nie tam, chyba że się mylę)
Peter Flom - Przywróć Monikę
@ Peter, interpretuję to pytanie jako podzbiór „Dlaczego dodam zmienną do mojego modelu, oszacowanie efektu / wartość dla niektórych innych zmian zmiennych?”, Które jest omówione w drugim pytaniu. Wśród odpowiedzi na te pytania są kolinearność (do której Gung nawiązuje w swojej odpowiedzi na to pytanie) / treść nakłada się między predyktorami (tj. Między a , co, jak podejrzewam, jest winowajcą w tym przypadku). Ta sama logika obowiązuje tutaj. Nie jestem pewien, co to za kontrowersja, ale w porządku, jeśli ty i inni nie zgadzacie się. Twoje zdrowie. D ( x 1 , x 2 1 )pre(x1,x12))
Makro

Odpowiedzi:

21

Po pierwsze, zmienna fikcyjna jest interpretowana jako zmiana przechwytywania. Oznacza to, że twój współczynnik daje różnicę w przecięcia, gdy , tzn. Gdy , punkt przecięcia to . Ta interpretacja nie zmienia się po dodaniu kwadratu . D = 1 D = 1 β 0 + β 3 x 1β3)re=1re=1β0+β3)x1

Teraz dodanie kwadratu do szeregu polega na założeniu, że relacja znika w pewnym momencie. Patrząc na twoje drugie równanie

y=β0+β1x1+β2)x12)+β3)re+ε

Biorąc pochodną wrt dajex1

δyδx1=β1+2)β2)x1

Rozwiązanie tego równania daje punkt zwrotny relacji. Jak wyjaśnił użytkownik1493368, rzeczywiście odzwierciedla to odwrotny kształt litery U, jeśli i odwrotnie. Weź następujący przykład:β1<0

y^=1.3+0,42x1-0,32x12)+0,14re

Pochodna wrt tox1

δyδx1=0,42-2)0,32x1

Rozwiązanie dla daje cix1

δyδx1=0x10.66

To jest punkt, w którym relacja ma swój punkt zwrotny. Możesz przyjrzeć się wynikowi Wolfram-Alpha dla powyższej funkcji, aby uzyskać wizualizację problemu.

Pamiętaj, interpretując efekt ceteris paribus zmiany na , musisz spojrzeć na równanie:x1y

Δy=(β1+2β2x1)Δx

Oznacza to, że nie można interpretować w izolacji, po dodaniu kwadratowego regresora !β1x12

Jeśli chodzi o twoje nieznaczne po uwzględnieniu kwadratu , wskazuje to na błąd błędnej specyfikacji.Dx1

altabq
źródło
Cześć. Jeśli miałeś kilka predyktorów, powinieneś stosować pochodne częściowe lub pochodne ogółem (różne)?
skan
1
Częściowa pochodna jest nadal właściwą drogą do przejścia tutaj. Interpretacja wszystkich współczynników to ceteris paribus , tzn. Utrzymywanie wszystkiego innego na stałym poziomie. Właśnie to robisz, gdy bierzesz częściową pochodną.
altabq
Zobacz tę stronę UCLA IDRE, aby uzupełnić świetną odpowiedź @ altabq.
Cyrille
19

Dobry przykład włączenia kwadratu zmiennej pochodzi z ekonomii pracy. Jeśli przyjmiesz yjako wynagrodzenie (lub dziennik wynagrodzenia) i xjako wiek, wówczas uwzględnienie x^2oznacza, że ​​testujesz kwadratową zależność między wiekiem a zarobkiem. Płaca rośnie wraz z wiekiem, gdy ludzie stają się bardziej doświadczeni, ale w wyższym wieku płaca zaczyna rosnąć w coraz mniejszym tempie (ludzie starzeją się i nie będą już tak zdrowi do pracy jak wcześniej), a w pewnym momencie płaca nie rośnie ( osiąga optymalny poziom płac), a następnie zaczyna spadać (przechodzą na emeryturę, a ich zarobki zaczynają maleć). Tak więc związek między płacą a wiekiem jest odwrócony w kształcie litery U (efekt cyklu życia). Ogólnie rzecz biorąc, dla wymienionego tutaj przykładu ageoczekuje się , że współczynnik on będzie dodatni i niż onage^2być negatywnym. Chodzi tutaj o to, że powinna istnieć podstawa teoretyczna / empiryczne uzasadnienie dla włączenia kwadratu zmiennej. Zmienną fikcyjną można tutaj uznać, że reprezentuje płeć pracownika. Możesz także dołączyć pojęcie interakcji płci i wieku, aby sprawdzić, czy różnica płci zależy od wieku.

Metryka
źródło