Przypadkowy problem z parametrem

15

Zawsze staram się uzyskać prawdziwą istotę problemu dotyczącego parametrów przypadkowych. Kilkakrotnie czytałem, że estymatory efektów stałych modeli danych nieliniowych paneli mogą być poważnie tendencyjne z powodu „dobrze znanego” problemu parametrów przypadkowych.

Kiedy proszę o jasne wyjaśnienie tego problemu, typowa odpowiedź brzmi: Załóżmy, że dane panelu obejmują N pojedynczych osób w T okresach. Jeśli T jest ustalone, gdy N rośnie, szacunki towarzyszące stają się tendencyjne. Dzieje się tak, ponieważ liczba niedogodnych parametrów rośnie szybko wraz ze wzrostem N.

Byłbym bardzo wdzięczny

  • bardziej precyzyjne, ale wciąż proste wyjaśnienie (jeśli to możliwe)
  • i / lub konkretny przykład, który mogę wypracować z R lub Statą.
Emeryville
źródło
3
To nie wystarczy na odpowiedź. Problem parametrów przypadkowych może wystąpić w modelach nieliniowych, które w przeciwieństwie do regresji liniowej nie mają właściwości bycia obiektywnymi estymatorami. Popularnym przykładem jest probit / logit. Modele te są spójnymi estymatorami, co oznacza, że ​​wraz ze wzrostem stosunku liczby obserwacji do liczby parametrów oszacowania parametrów zbiegają się do ich prawdziwych wartości, gdy standardowe błędy stają się arbitralnie małe. Problem ze stałymi efektami polega na tym, że liczba parametrów rośnie wraz z liczbą obserwacji.
Zachary Blumenfeld,
2
Dlatego oszacowania parametrów nigdy nie mogą zbiegać się z ich prawdziwą wartością, gdy zwiększa się wielkość próby. Dlatego oszacowania parametrów są poważnie niewiarygodne.
Zachary Blumenfeld,
Dziękuję za to wyjaśnienie. Chyba lepiej rozumiem problem. Tak więc np. Jeśli mój panel to T = 8, a N = 2000, mogę dodać efekty ustalone dla T w oszacowaniu probit / logit i uzyskać wiarygodne oszacowania. W przeciwnym razie, z efektami N-ustalonymi, dostałbym te niewiarygodne. Czy to jest poprawne?
emeryville,
2
Oto wpisy na blogu ilustrujące przypadkowy parametr problemu dla logit i probit na przykładzie w R: econometricsbysimulation.com/2013/12/…
Arne Jonas Warnke

Odpowiedzi:

21

W modelach FE typu α jest parametrem ubocznym, ponieważ teoretycznie ma on drugorzędne znaczenie. Zwykle β jest ważnym parametrem statystycznie. Ale w gruncie rzeczy α jest ważne, ponieważ dostarcza użytecznych informacji na temat pojedynczego przechwytywania.

yit=αi+βXit+uit
αβα

β

yit=αi+uituitiiN(0,σ2)
u^jat=yjat-y¯jaασ2)
σ^2)=1N.T.jat(yjat-y¯ja)2)=σ2)χN.(T.-1)2)N.T.=σ2)N.(T.-1)N.T.=σ2)T.-1T.

T.-1T.σ2)

β

Zauważ, że na przykład w panelach przestrzennych sytuacja jest odwrotna - T jest zwykle uważane za wystarczająco duże, ale N jest ustalone. A więc asymptotyka pochodzi od T. Dlatego w panelach przestrzennych potrzebujesz dużego T!

Mam nadzieję, że to jakoś pomaga.

Corel
źródło
1N.T.jat(yjat-y¯ja)2)σ2)χN.(T.-1)2)N.T.
1
@Mario GS: Suma kwadratowych normalnych zmiennych losowych jest rozkładem chi-kwadrat
Corel