Przydatność twierdzenia Frisch-Waugh

15

Mam uczyć twierdzenia Frisha Waugha w ekonometrii, której nie studiowałem.

Zrozumiałem matematykę, która się za tym kryje, i mam nadzieję, że pomysł „współczynnik, który otrzymujesz dla określonego współczynnika z wielokrotnego modelu liniowego, jest równy współczynnikowi prostego modelu regresji, jeśli„ wyeliminujesz ”wpływ innych regresorów”. Więc teoretyczny pomysł jest całkiem fajny. (Jeśli całkowicie źle zrozumiałem, z zadowoleniem przyjmuję korektę)

Ale czy ma jakieś klasyczne / praktyczne zastosowania?

EDYCJA : Zaakceptowałem odpowiedź, ale nadal chcę mieć nowe, które przynoszą inne przykłady / aplikacje.

Anthony Martin
źródło
4
Oczywistym byłoby dodanie zmiennych wykresów ?
Silverfish,
1
Wstęp Dougherty'ego do ekonometrii wymienia inny przykład zastosowania twierdzenia Frisch-Waugh-Lovell. We wczesnych dniach ekonometrycznej analizy szeregów czasowych dość często zdarzały się modele, w których zmienne miały deterministyczne trendy czasowe, aby je wszystkie zniechęcić przed regresją. Ale dzięki FWL uzyskuje się te same współczynniki po prostu poprzez uwzględnienie trendu czasowego jako regresora, a ponadto daje to „prawidłowe” standardowe błędy, ponieważ potwierdza to, że 1 df został w ten sposób zużyty.
Silverfish,
1
Dougherty ostrzega przed tą procedurą, więc pod tym względem nie jest to świetny przykład, choć pouczający. Zmienne ekonomiczne często wydają się raczej stacjonarne od różnic niż stacjonarne od trendów, więc tego rodzaju próba rezygnacji nie działa i może skutkować fałszywymi regresjami.
Silverfish,
1
@Silverfish: FWL jest techniką czysto algebraiczną, więc kwestia, czy wyodrębnienie deterministycznego trendu jest „właściwa”, biorąc pod uwagę leżącą u podstaw MZD, jest bez wątpienia ważna, ale nie jest powiązana z FWL, więc w tym sensie twój przykład jest całkowicie poprawny dla OP kwestionuje dwa sposoby uzyskiwania oszacowań punktowych.
Christoph Hanck
2
Wykorzystałem ten związek w wielu postach, przede wszystkim w celach koncepcyjnych i w celu dostarczenia interesujących przykładów zjawisk regresji. Patrz, między innymi , stats.stackexchange.com/a/46508 , stats.stackexchange.com/a/113207 i stats.stackexchange.com/a/71257 .
whuber

Odpowiedzi:

14

Rozważ model danych panelu ze stałymi efektami, znany również jako model zmiennych zmiennych najmniejszych kwadratów (LSDV).

można obliczyć przez bezpośrednie zastosowanie OLS do modelu y = X β + D α + ϵ , gdziejestmacierząmanekinów, areprezentuje ustalone efekty specyficzne dla poszczególnych osób.bLSDV

y=Xβ+Dα+ϵ,
N T × N αDNT×Nα

Innym sposobem obliczenia jest zastosowanie tzw. Transformacji wewnątrz do zwykłego modelu w celu uzyskania poniższej wersji, tj. Tutaj resztkowe matrycy Twórcy regresji na . M [ D ] y = M [ D ] X β + M [ D ] ϵ . M [ D ] = I - D ( D D ) - 1 D DbLSDV

M[D]y=M[D]Xβ+M[D]ϵ.
M[D]=ID(DD)1DD

Według twierdzenia Frisch-Waugh-Lovell oba są równoważne, ponieważ FWL mówi, że można obliczyć podzbiór współczynników regresji regresji (tutaj ) przezβ^

  1. regresując na innych regresorach (tutaj, ), zapisując resztki (tutaj, czasowe lub , ponieważ regresja na stałej tylko określa zmienne), toD y M [ D ] yyDyM[D]y
  2. cofnięcie na i zapisanie resztek , iD M [ D ] XXDM[D]X
  3. cofa się z pozostałości na siebie, o .M [ D ] XM[D]yM[D]X

Druga wersja jest znacznie szerzej stosowana, ponieważ typowe zestawy danych panelu mogą mieć tysiące jednostek panelu , tak więc pierwsze podejście wymagałoby przeprowadzenia regresji z tysiącami regresorów, co nie jest dobrym pomysłem liczbowym nawet w dzisiejszych czasach z szybkim komputery, ponieważ obliczenie odwrotności byłoby bardzo drogie, podczas gdy poniżające w czasie i są mało kosztowne.( D : X ) ( D : X ) y XN(D:X)(D:X)yX

Christoph Hanck
źródło
Dziękuję bardzo, to jest odpowiedź, której szukałem, mimo że jej użycie jest nieco zaawansowane. Więc twoja odpowiedź jest dla mnie w porządku, ale byłbym szczęśliwy, gdybym miał inne, czy mam przyjąć twoją?
Anthony Martin
Jeśli to pomogłoby, byłoby to właściwe. Ale zaakceptowanie zmniejszy twoje szanse na uzyskanie lepszych odpowiedzi, więc możesz rozważyć poczekanie przed zaakceptowaniem tego. Nagroda dodatkowo zwiększy Twoje szanse na uzyskanie większej liczby odpowiedzi - biorąc pod uwagę, że w CV nie ma wystarczającej liczby użytkowników, którzy regularnie odpowiadają na pytania, biorąc pod uwagę liczbę pytań, nawet jedna odpowiedź może doprowadzić innych aktywnych użytkowników do wniosku, że pytania zostały rozwiązane. (Ja zamieściłem nieco prostszą odpowiedź poniżej.)
Christoph Hanck
7

Oto uproszczona wersja mojej pierwszej odpowiedzi, która moim zdaniem jest mniej praktyczna, ale być może łatwiejsza do „sprzedaży” do użytku w klasie.

yi=β1+j=2Kβjxij+ϵi
yiy¯=j=2Kβj(xijx¯j)+ϵ~i
β^jj=2,,Kx1=1:=(1,,1)
M1=I1(11)11=I11n,
M1xj=xj1n11xj=xj1x¯j=:xjx¯j.
M1xjyi
Christoph Hanck
źródło
4

Oto inny, bardziej pośredni, ale uważam, że interesujący, mianowicie związek między różnymi podejściami do obliczania częściowego współczynnika autokorelacji stacjonarnych szeregów czasowych.

Definicja 1

Y^tμ=α1(m)(Yt1μ)+α2(m)(Yt2μ)++αm(m)(Ytmμ)
mαm(m)

mYtYt1,,Ytm+1ρmYtYtm

αj(m)ZtXt

E[Xt(ZtXtα(m))]=0
α(m)
α(m)=[E(XtXt)]1E[XtZt]
Zt=Ytμ
Xt=[(Yt1μ),(Yt2μ),,(Ytmμ)]
E(XtXt)=(γ0γ1γm1γ1γ0γm2γm1γm2γ0)
E(XtZt)=(γ1γm)
α(m)=(γ0γ1γm1γ1γ0γm2γm1γm2γ0)1(γ1γm)
mα(m)

Tak więc prowadzimy regresję wielokrotną i znajdujemy jeden współczynnik zainteresowania, kontrolując pozostałe.

Definicja 2

mYt+mYt1,,Ytm+1YtYt1,,Ytm+1

Tak więc najpierw przeprowadzamy kontrolę opóźnień pośrednich, a następnie obliczamy korelację reszt.

Christoph Hanck
źródło