Zadałem podobne pytanie na Cross Validated, ale nie otrzymałem odpowiedzi. Następujące pytanie jest wystarczająco różne.
Rozważ następującą zależność deterministyczną: $$ Y_ {t} = C_ {t} + I_ {t} + G_ {t} + (X_ {t} -M_ {t}) $$
Jeśli uruchomimy regresję OLS dla Y na kowariancjach oczywiście otrzymujemy $ R ^ {2} $ 1, a wektor współczynników równy ich odpowiednikom populacji, tj. $$ {} B = 1 $$
Oznacza to, że marginalny efekt każdego regresora jest stały. Jednak udział każdego regresora zależy od jego względnej wariancji względem y. W rzeczywistości w przypadku jednoczynnikowym można pokazać, że: $$ R ^ {2} = beta ^ {2} frak {var (x)} {var (y)} $$ co pokazuje, że nawet gdy marginalny efekt $ x $ na $ y $ jest duży, jego wkład w częściowe $ R ^ {2} $ sens jest wysoki tylko wtedy, gdy zmienia się znacznie, powodując y aby się z tym różnić.
Rozważmy teraz powyższe wyrażenie: $$ Y_ {t} = C_ {t} + I_ {t} + G_ {t} + (X_ {t} -M_ {t}) $$
Podzielmy obie strony przez $ Y_ {t} $ dla całego wektora współczynników i macierzy projektu.
Otrzymujemy: $$ 1 = frac {C_ {t}} {Y_ {t}} + frac {I_ {t}} {Y_ {t}} + frac {G_ {t}} {Y_ {t}} + frac {(X_ {t} -M_ {t})} {Y_ {t}} $$
Dotyczy to każdej realizacji $ Y {t} $ i matryca projektowa według konstrukcji. Teraz każdy regresor to względny wkład (który możemy pomnożyć przez 100, aby uzyskać procentowy wkład) do zmiennej zależnej.
Teraz, gdy mamy dla każdego obserwacji względny udział każdego regresora, możemy uzyskać średni udział regresora w obserwacjach.
Przeprowadziłem kilka symulacji i odkryłem, że średni wkład każdego regresora jest bliski, ale nie dokładnie równy częściowemu R $ {2} $ każdego regresora. Czy istnieje między nimi związek? Intuicyjnie powinny być takie same, prawda? Wielkie dzięki!
źródło