Jak zachować zmienne niezmienne czasowe w modelu o ustalonych efektach

15

Mam dane na temat pracowników dużej włoskiej firmy w ciągu dziesięciu lat i chciałbym zobaczyć, jak zmieniła się z czasem różnica między płciami w zarobkach kobiet i mężczyzn. W tym celu uruchamiam połączone OLS:

yjat=Xjatβ+δmzalmija+t=110γtret+εjat
gdzie y to dzienne zarobki rocznie, Xjat obejmuje zmienne towarzyszące, które różnią się w zależności od jednostki i czasu, retsą manekinami rocznymi, a mzalmija równa się jeden, jeśli pracownik jest mężczyzną, a w przeciwnym razie wynosi zero.

Teraz obawiam się, że niektóre zmienne towarzyszące mogą być skorelowane z niezauważonymi ustalonymi efektami. Ale kiedy używam estymatora efektów stałych (wewnątrz) lub pierwszych różnic, tracę manekin płciowy, ponieważ zmienna ta nie zmienia się w czasie. Nie chcę korzystać z estymatora efektów losowych, ponieważ często słyszę, jak ludzie mówią, że przyjmuje założenia, które są bardzo nierealistyczne i mało prawdopodobne.

Czy są jakieś sposoby na zachowanie manekina płci i kontrolowanie stałych efektów w tym samym czasie? Jeśli istnieje sposób, czy muszę grupować lub rozwiązywać inne problemy z błędami testów hipotez dotyczących zmiennej płci?

użytkownik42263
źródło

Odpowiedzi:

22

Istnieje kilka potencjalnych sposobów utrzymania manekina płciowego w regresji stałych efektów.

W estymatorze
Załóżmy, że masz podobny model w porównaniu z połączonym modelem OLS, który wynosi w którym zmienne są takie, jak wcześniej. Zauważmy teraz, że β 1 i β 1 + γ 1 ( m a l e i ) nie mogą być zidentyfikowane, ponieważ estymator wewnętrzny nie może odróżnić ich od efektu stałego c i . Biorąc pod uwagę, że β 1 jest punktem przecięcia dla roku bazowego t = 1 , γ 1 to wpływ płci na zarobki w tym okresie. Co możemy zidentyfikować w tym przypadku są γ 2 , . , γ 10

yit=β1+t=210βtdt+γ1(malei)+t=110γt(dtmalei)+Xitθ+ci+ϵit
β1β1+γ1(malei)ciβ1t=1γ1γ2,...,γ10 ponieważ wchodzą w interakcje z manekinami czasu i mierzą różnice w częściowych skutkach zmiennej płci w stosunku do pierwszego okresu. To znaczy, że obserwujemy wzrost swojej w miarę upływu czasu jest to wskazanie do zwiększenia luki zarobkowej między mężczyznami i kobietami.γ2,...,γ10

Estymator pierwszej różnicy
Jeśli chcesz poznać ogólny efekt różnicy między mężczyznami i kobietami w czasie, możesz wypróbować następujący model: gdzie zmienna t = 1 , 2 ,

yit=β1+t=210βtdt+γ(tmalei)+Xitθ+ci+ϵit
wchodzi w interakcję z niezmiennym w czasie manekinem płci. Teraz, jeśli weźmiesz pierwsze różnice β 1 i c i wypadną i otrzymasz y i t - y i ( t - 1 ) = 10 t = 3 β t ( d t - d ( t - 1 ) ) + γ ( t m a l e i -t=1,2,...,10β1ci Następnie γ ( t m a l e i - [ ( t - 1 ) m
yityi(t1)=t=310βt(dtd(t1))+γ(tmalei[(t1)malei])+(XitXi(t1))θ+ϵitϵi(t1)
i można zidentyfikować różnicę płci w zarobkach γ . Zatem końcowe równanie regresji będzie następujące: Δ y i t = 10 t = 3 β t Δ d t + γ (γ(tmalei[(t1)malei])=γ[(t(t1))malei]=γ(malei)γ a otrzymasz efekt zainteresowania. Zaletą jest to, że łatwo to zaimplementować w dowolnym oprogramowaniu statystycznym, ale tracisz pewien okres czasu.
Δyit=t=310βtΔdt+γ(malei)+ΔXitθ+Δϵit


ci1ci2

y~it=X~1it+X~2it+γ(male~i2)+c~i+ϵ~it
X~1it=X1itθ^iX¯1i where θ^i is used for the random effects transformation and X¯1i is the time-average over each individual. This isn't like the usual random effects estimator that you wanted to avoid because group 2 variables are instrumented for in order to remove the correlation with ci. For X~2it the instrument is X2itX¯2i. The same is done for the time-invariant variables, so if you specify the gender variable to be potentially correlated with the fixed effect it gets instrumented with X¯1i, so you must have more time-varying than time-invariant variables.

All of this might sound a little complicated but there are canned packages for this estimator. For instance, in Stata the corresponding command is xthtaylor. For further information on this method you could read Cameron and Trivedi (2009) "Microeconometrics Using Stata". Otherwise you can just stick with the two previous methods which are a bit easier.

Inference
For your hypothesis tests there is not much that needs to be considered other than what you would need to do anyway in a fixed effects regression. You need to take care for the autocorrelation in the errors, for example by clustering on the individual ID variable. This allows for an arbitrary correlation structure among clusters (individuals) which deals with autocorrelation. For a reference see again Cameron and Trivedi (2009).

Andy
źródło
4

Another potential way for you to keep the gender dummy is the the Mundlak's (1978) approach for a fixed effect model with time invariant variables. The Mundlak's approach would posit that the gender effect can be projected upon the group means of the time-varying variables.

Mundlak, Y. 1978: On the pooling of time series and cross section data. Econometrica 46:69-85.

emeryville
źródło
2

Another method is to estimate the time-invariant coefficients in a second stage equation, using the mean error as the dependent variable.

First, estimate the model with FE. From here you get an estimation of β and γt. For simplicity, let's forget about the year-effects. Define the estimation error u^it as before:

u^ityitXitβ^

The linear predictor u¯i is:

u¯it=1Tu^iT=yit¯x¯iβ^

Now, consider the following second stage equation:

u¯i=δmalei+ci

Assuming that gender is uncorrelated with unobserved factors ci. Then, the OLS estimator of δ is unbiased and time-consistent (this is, it is consistent when T).


To prove the above, replace the original model into the estimator u¯i:

u¯i=x¯iβx¯iβ^+δmalei+ci+t=1TϵitT

The expectation of this estimator is:

E(u¯i)=x¯iβx¯iE(β^)+δmalei+E(ci)+t=1TE(ϵit)T

If assumptions for FE consistency hold, β^ is an unbiased estimator of β, and E(ϵit)=0. Thus:

E(u¯i)=δmalei+E(ci)

This is, our predictor is an unbiased estimator of the time-invariant components of the model.

Regarding consistency, the probability limit of this predictor is:

plimTu¯i=plimT(x¯iβ)plimT(x¯iβ^)+plimTδmalei+plimTci+plimT(t=1TϵitT)

Again, given FE assumptions, β^ is a consistent estimator of β, and the error term converges to its mean, which is zero. Therefore:

plimTu¯i=δmalei+ci

Again, our predictor is a consistent estimator of the time-invariant components of the model.

luchonacho
źródło
1

Urządzenie szambelana Mundlak jest do tego idealnym narzędziem. Jest zwykle określany jako skorelowany model efektów losowych, ponieważ wykorzystuje model efektów losowych do niejawnego oszacowania stałych efektów dla zmiennych wariantów czasowych, a także do oszacowania efektów losowych dla zmiennych niezmienniczych w czasie.

Jednak w oprogramowaniu statystycznym zaimplementujesz to samo jako model efektu losowego, ale musisz dodać średnie dla zmiennych towarzyszących wszystkich wariantów czasowych.

Martin Paul
źródło