Kiedy wykonujemy wiele regresji i mówimy, że patrzymy na średnią zmianę zmiennej dla zmiany zmiennej , utrzymując wszystkie pozostałe zmienne na stałym poziomie, na jakich wartościach utrzymujemy inne zmienne jako stałe? Ich średni? Zero? Dowolna wartość?
Jestem skłonny myśleć, że to ma jakąkolwiek wartość; tylko szukam wyjaśnień. Gdyby ktoś miał dowód, to też byłoby świetnie.
multiple-regression
interpretation
least-squares
regression-coefficients
controlling-for-a-variable
EconStats
źródło
źródło
Odpowiedzi:
Masz rację. Technicznie jest to dowolna wartość . Jednakże, kiedy uczę tego, zwykle mówię ludziom, że otrzymujesz efekt zmiany jednej jednostki w gdy wszystkie inne zmienne są utrzymywane na ich odpowiednich . Uważam, że jest to powszechny sposób na wyjaśnienie tego, co nie jest dla mnie specyficzne.Xj
Zazwyczaj że jeśli nie masz żadnych interakcji, będzie efektem zmiany jednej jednostki w , bez względu na wartości innych zmiennych. Ale lubię zaczynać od przeciętnego sformułowania. Powodem są dwa efekty włączenia wielu zmiennych do modelu regresji. Po pierwsze, otrzymujesz efekt kontrolowania dla innych zmiennych (patrz moja odpowiedź tutaj ). Drugi polega na tym, że obecność innych zmiennych (zwykle) zmniejsza resztkową wariancję modelu, tworząc twoje zmienne (w tymX j X j X j Xβj Xj Xj Xj ) 'bardziej znaczący'. Ludziom trudno jest zrozumieć, jak to działa, jeśli inne zmienne mają wartości, które są wszędzie. Wygląda na to, że zwiększyłoby to zmienność. Jeśli myślisz o dostosowaniu każdego punktu danych w górę lub w dół o wartość każdej innej zmiennej, dopóki wszystkie pozostałe zmienne nie zostaną przeniesione do odpowiednich wartości, łatwiej jest zauważyć, że zmienność resztkowa została zmniejszona. X
Nie wchodzę w interakcje, dopóki klasa lub dwie po wprowadzeniu podstaw regresji wielokrotnej. Jednak kiedy do nich docieram, wracam do tego materiału. Powyższe stosuje się, gdy nie ma interakcji. Kiedy występują interakcje, jest to bardziej skomplikowane. W takim przypadku zmienne oddziałujące [s] są utrzymywane na stałym poziomie (bardzo konkretnie) na poziomie i na żadnej innej wartości.0
Jeśli chcesz zobaczyć, jak to wygląda algebraicznie, jest to raczej proste. Możemy zacząć od przypadku braku interakcji. Określmy zmianę w gdy wszystkie inne zmienne są utrzymywane na stałym poziomie w odpowiednich środkach. Bez utraty ogólności, powiedzmy, że istnieją trzy zmienne i jesteśmy zainteresowani zrozumieniem, w jaki sposób zmiana jest powiązana ze zmianą jednej jednostki w , utrzymując i stałym poziomie: X Y X3X1X2Y^ X Y^ X3 X1 X2
Teraz jest oczywiste, że moglibyśmy umieścić dowolną wartość dla i w pierwszych dwóch równaniach, pod warunkiem, że wstawimy tę samą wartość dla ( ) w obu z nich. To znaczy, dopóki trzymamy i stałą . X 2X1 X2) X 2 X 1 X 2X1 X2) X1 X2)
Z drugiej strony nie działa to w ten sposób, jeśli masz interakcję. Tutaj pokazuję przypadek, w którym występuje termin interakcji :X1X3)
W takim przypadku nie jest możliwe utrzymanie stałej wartości wszystkich pozostałych. Ponieważ termin interakcji jest funkcją i , zmiana nie jest możliwa bez zmiany terminu interakcji. Zatem równa się zmianie związanej ze zmianą jednej jednostki w tylko wtedy, gdy zmienna interakcji ( ) jest utrzymywana na poziomie zamiast (lub dowolnej innej wartości poza ), w którym to przypadku ostatni termin w dolnym równaniu odpada. X 3 X 3X1 X3) X3) Y X3X10 ˉ X 10β^3) Y^ X3) X1 0 X¯1 0
W tej dyskusji skupiłem się na interakcjach, ale bardziej ogólnie problem polega na tym, że jest jakaś zmienna będąca funkcją innej, tak że nie można zmienić wartości pierwszej bez zmiany odpowiedniej wartości drugiej zmiennej . W takich przypadkach znaczenie staje się bardziej skomplikowane. Na przykład, jeśli miałeś model z i , to jest pochodną utrzymującą wszystkie pozostałe równe i posiadającą (patrz moja odpowiedź tutaj ). Możliwe są również inne, jeszcze bardziej skomplikowane formulacje. XJX 2 Jβ^jot Xjot X2)jot dYβ^jot Xj=0reYreXjot Xjot= 0
źródło
Matematyka jest prosta, wystarczy wziąć różnicę między 2 modelami z jedną zmienną x zmienioną o 1, a zobaczysz, że nie ma znaczenia, jakie są inne zmienne (pod warunkiem, że nie ma interakcji, wielomianu lub innych skomplikowanych terminów).
Jeden przykład:
źródło
Uważam, że masz na myśli zależność w zmiennych towarzyszących ( ). Więc jeśli modelem jest wpływ na wszystkie pozostałe rzeczy będą równe to dla dowolnego z wszystkimi innymi utrzymywanymi stałymi na dowolnej wartości.Xja
Należy pamiętać, że możliwe jest, że i są zależne (np. Funkcje od siebie), niekoniecznie wykazując znaczącą interakcję w modelu liniowym ( w ).X 2X1 X2) β12= 0 Y= β0+ β1X1+ β2)X2)+ β12X1X2)
Ciekawą styczną jest tutaj przykład: Niech i to oczywiście każda zmiana w wpłynie na . Jednak kowariancja między nimi wynosi zero. X 2 = X 2 1 + N ( 0 , σ 2 2 ) X 1X1∼ N.( 0 , σ2)1) X2)= X2)1+ N( 0 , σ2)2)) X1 X2)
Tak więc w rzeczywistości zmiana byłaby powiązana ze zmianą a nie obejmowałoby tego, co naprawdę by się stało, gdybyś zmienił . Ale nadal byłby opisywany jako wpływ na wszystkich rzeczy równych.X 2 Δ YX1 X2) X1ÆYΔ YΔ Xja X1 XiYΔ YΔ Xja Xja Y
Jest to porównywalne z różnicą między pochodną pełną a pochodną cząstkową (analogiem ) w równaniu różniczkowym.Δ YΔ Xja
źródło