Przypadkowy problem z parametrem

Zawsze staram się uzyskać prawdziwą istotę problemu dotyczącego parametrów przypadkowych. Kilkakrotnie czytałem, że estymatory efektów stałych modeli danych nieliniowych paneli mogą być poważnie tendencyjne z powodu „dobrze znanego” problemu parametrów przypadkowych.

Kiedy proszę o jasne wyjaśnienie tego problemu, typowa odpowiedź brzmi: Załóżmy, że dane panelu obejmują N pojedynczych osób w T okresach. Jeśli T jest ustalone, gdy N rośnie, szacunki towarzyszące stają się tendencyjne. Dzieje się tak, ponieważ liczba niedogodnych parametrów rośnie szybko wraz ze wzrostem N.

Byłbym bardzo wdzięczny

bardziej precyzyjne, ale wciąż proste wyjaśnienie (jeśli to możliwe)
i / lub konkretny przykład, który mogę wypracować z R lub Statą.

nonlinear-regression fixed-effects-model bias Emeryville
źródło

To nie wystarczy na odpowiedź. Problem parametrów przypadkowych może wystąpić w modelach nieliniowych, które w przeciwieństwie do regresji liniowej nie mają właściwości bycia obiektywnymi estymatorami. Popularnym przykładem jest probit / logit. Modele te są spójnymi estymatorami, co oznacza, że wraz ze wzrostem stosunku liczby obserwacji do liczby parametrów oszacowania parametrów zbiegają się do ich prawdziwych wartości, gdy standardowe błędy stają się arbitralnie małe. Problem ze stałymi efektami polega na tym, że liczba parametrów rośnie wraz z liczbą obserwacji.

Zachary Blumenfeld,

Dlatego oszacowania parametrów nigdy nie mogą zbiegać się z ich prawdziwą wartością, gdy zwiększa się wielkość próby. Dlatego oszacowania parametrów są poważnie niewiarygodne.

Zachary Blumenfeld,

Dziękuję za to wyjaśnienie. Chyba lepiej rozumiem problem. Tak więc np. Jeśli mój panel to T = 8, a N = 2000, mogę dodać efekty ustalone dla T w oszacowaniu probit / logit i uzyskać wiarygodne oszacowania. W przeciwnym razie, z efektami N-ustalonymi, dostałbym te niewiarygodne. Czy to jest poprawne?

emeryville,

Oto wpisy na blogu ilustrujące przypadkowy parametr problemu dla logit i probit na przykładzie w R: econometricsbysimulation.com/2013/12/…

Arne Jonas Warnke

Odpowiedzi:

W modelach FE typu jest parametrem ubocznym, ponieważ teoretycznie ma on drugorzędne znaczenie. Zwykle jest ważnym parametrem statystycznie. Ale w gruncie rzeczy jest ważne, ponieważ dostarcza użytecznych informacji na temat pojedynczego przechwytywania.

y_{i t} = α_{i} + β X_{i t} + u_{i t}

$y_{it} = \alpha_i + \beta X_{it} + u_{it}$

α

$\alpha$

β

$\beta$

α

$\alpha$

$\beta$

y_{i t} = α_{i} + u_{i t} u_{i t} \sim i i N (0, σ^{2})

$y_{it} = \alpha_i + u_{it} \quad \quad u_{it}\sim iiN(0,\sigma^2)$

{\hat{u}}_{i t} = y_{i t} - {\bar{y}}_{i}

$\hat{u}_{it} = y_{it}-\bar{y}_i$

α

$\alpha$

σ^{2}

$\sigma^2$

{\hat{σ}}^{2)} = \frac{1}{N. T.} \sum_{ja} \sum_{t} (y_{ja t} - {\bar{y}}_{ja})^{2)} = σ^{2)} \frac{χ_{N. (T. - 1)}^{2)}}{N. T.} = σ^{2)} \frac{N. (T. - 1)}{N. T.} = σ^{2)} \frac{T. - 1}{T.}

$\hat{\sigma}^2 = \frac{1}{NT}\sum_i\sum_t (y_{it}-\bar{y}_i)^2 = \sigma^2\frac{\chi_{N(T-1)}^2}{NT} = \sigma^2\frac{N(T-1)}{NT} = \sigma^2\frac{T-1}{T}$

$\frac{T-1}{T}$ $\sigma^2$

$\beta$

Zauważ, że na przykład w panelach przestrzennych sytuacja jest odwrotna - T jest zwykle uważane za wystarczająco duże, ale N jest ustalone. A więc asymptotyka pochodzi od T. Dlatego w panelach przestrzennych potrzebujesz dużego T!

Mam nadzieję, że to jakoś pomaga.

Corel
źródło

\frac{1}{N T} \sum_{i} \sum_{t} (y_{i t} - {\bar{y}}_{i})^{2}

$\frac{1}{NT}\sum_i\sum_t (y_{it}-\bar{y}_i)^2$

σ^{2} \frac{χ_{N (T - 1)}^{2}}{N T}

$\sigma^2\frac{\chi_{N(T-1)}^2}{NT}$

@Mario GS: Suma kwadratowych normalnych zmiennych losowych jest rozkładem chi-kwadrat

Corel