Błędy normalnie rozłożone i centralne twierdzenie graniczne

9

We wstępnej ekonometrii Wooldridge'a jest cytat:

Argument uzasadniający normalną dystrybucję błędów zwykle działa mniej więcej tak: ponieważ u jest sumą różnych wpływających na nie zaobserwowanych czynników y, możemy odwołać się do centralnego twierdzenia o granicy, aby dojść do wniosku u ma przybliżony rozkład normalny.

Ten cytat dotyczy jednego z założeń modelu liniowego, a mianowicie:

uN(μ,σ2)

gdzie jest terminem błędu w modelu populacji.u

O ile mi wiadomo, centralne twierdzenie graniczne stwierdza, że ​​rozkład

Zi=(Yi¯μ)/(σ/n)

(gdzie Yi¯ to średnie z losowych próbek pobranych z dowolnej populacji ze średnią μ i wariancją σ2 )

zbliża się do standardowej zmiennej normalnej jako n .

Pytanie:

Pomóż mi zrozumieć, w jaki sposób asymptotyczna normalność Zi implikuje uN(μ,σ2)

gęś
źródło

Odpowiedzi:

13

Można to lepiej docenić, wyrażając wynik CLT jako sumę zmiennych losowych iid. Mamy

nX¯μσN(0,1)asymptotically

Mnożenie przez iloraz i wykorzystują fakt, że aby uzyskaćσnVar(cX)=c2Var(X)

X¯μN(0,σ2n)

Teraz dodaj do LHS i wykorzystaj fakt, że aby uzyskaćμE[aX+μ]=aE[X]+μ

X¯=1ni=1nXiN(μ,σ2n)

Na koniec pomnóż przez i użyj powyższych dwóch wyników, aby to zobaczyćn

i=1nXiN(nμ,nσ2)

A co to ma wspólnego z oświadczeniem Wooldridge? Cóż, jeśli błąd jest sumą wielu losowych zmiennych iid, to będzie w przybliżeniu normalnie rozłożony, jak właśnie widzieliśmy. Ale jest tutaj problem, mianowicie, że niezauważone czynniki niekoniecznie muszą być identycznie rozmieszczone i mogą nawet nie być niezależne!

Niemniej jednak CLT z powodzeniem rozszerzono na niezależne, nie identycznie rozmieszczone zmienne losowe, a nawet przypadki łagodnej zależności, pod pewnymi dodatkowymi warunkami prawidłowości. Są to zasadniczo warunki, które gwarantują, że żaden termin w sumie nie wywiera nieproporcjonalnego wpływu na asymptotyczny rozkład, patrz także strona wikipedia na CLT . Oczywiście nie musisz znać tych wyników; Celem Wooldridge jest jedynie zapewnienie intuicji.

Mam nadzieję że to pomoże.

JohnK
źródło
Dodałbym (skoro autor bada ekonometrię), że na jego polu badań wiele zmiennych losowych (przynajmniej tych wykorzystywanych do modelowania) nie ma zdefiniowanych momentów pierwszych, takich jak rozkład Cauchy'ego. Dlatego CLT nie jest tym, na którym można polegać w tej dziedzinie.
Niemiecki Demidov