Duża próba asymptotyczna / teoria - po co się tym przejmować?

13

Mam nadzieję, że to pytanie nie zostanie oznaczone jako „zbyt ogólne” i mam nadzieję, że rozpocznie się dyskusja, która przyniesie korzyści wszystkim.

W statystykach poświęcamy dużo czasu na naukę teorii dużych próbek. Jesteśmy głęboko zainteresowani oceną asymptotycznych właściwości naszych estymatorów, w tym tego, czy są one asymptotycznie bezstronne, asymptotycznie wydajne, ich asymptotyczny rozkład i tak dalej. Słowo asymptotyczne jest ściśle związane z założeniem, że .n

W rzeczywistości jednak zawsze mamy do czynienia ze skończonym . Moje pytania to:n

1) co rozumiemy przez dużą próbkę? Jak możemy rozróżnić małe i duże próbki?

2) Kiedy mówimy , czy dosłownie mamy na myśli, że powinien przejść do ?n nn

np. dla rozkładu dwumianowego, potrzebuje około n = 30, aby uzyskać rozkład normalny w CLT. Czy powinniśmy mieć czy w tym przypadku przez mamy na myśli 30 lub więcej ?! nX¯n

3) Załóżmy, że mamy skończoną próbkę i załóżmy, że wiemy wszystko o asymptotycznym zachowaniu naszych estymatorów. Więc co? przypuśćmy, że nasze estymatory są asymptotycznie obiektywne, to czy mamy obiektywne oszacowanie naszego parametru zainteresowania naszą skończoną próbką, czy oznacza to, że gdybyśmy mieli , mielibyśmy taki obiektywny?n

Jak widać z powyższych pytań, staram się zrozumieć filozofię stojącą za „dużą próbką asymptotyczną” i dowiedzieć się, dlaczego nas to obchodzi? Potrzebuję intuicji dla twierdzeń, których się uczę.

Sam
źródło
5
Zachowanie dużej próby jest jednym ze sposobów wykazania, że ​​dany estymator działa, lub cokolwiek innego, na granicy nieskończonych danych. Masz rację, że niekoniecznie mówi nam to o tym, jak dobry jest estymator w praktyce, ale jest to pierwszy krok: prawdopodobnie nie będziesz chciał użyć estymatora, który nie jest asymptotycznie spójny (lub cokolwiek innego). Zaletą analizy asymptotycznej jest to, że często łatwiej ją rozgryźć niż analizę skończoną.
Dougal
Powinieneś zacząć czytać o asymptotyce wyższego rzędu, ponieważ najwyraźniej znasz tylko normę asymptotyczną pierwszego rzędu i tym podobne; dzięki temu nie wiesz jeszcze wszystkiego o zachowaniu asymptotycznym. To tak, jakby powiedzieć: „Wiem, że ; dlaczego wszyscy mówią, że sinus jest okresowy ???”. sinx=x
StasK
1
W przypadku rozkładu dwumianowego jest złym kryterium. Jeśli i , średnia = 0,03 SD = 0,173, to przy wartości nominalnej, to prawdopodobieństwo, że zmienna dwumianowego jest poniżej zera, poprzez normalnego przybliżeniu 43%, która jest prawie dopuszczalne przybliżenie zera . Lepsze reguły sugerują i uwzględniają te problemy wyższego rzędu. n>30p=0.001n=30nmin(p,1p)>15
StasK

Odpowiedzi:

6

Lepiej późno niż wcale. Pozwól mi najpierw wymienić trzy (uważam, że ważne) powody, dla których skupiamy się na asymptotycznej bezstronności (spójności) estymatorów.

a) Spójność jest minimalnym kryterium. Jeśli estymator nie oszacuje poprawnie nawet przy dużej ilości danych, to co to jest dobrego? Takie jest uzasadnienie podane w Wooldridge: Introductory Econometrics.

b) Skończone właściwości próbki są znacznie trudniejsze do udowodnienia (a raczej stwierdzenia asymptotyczne są łatwiejsze). Obecnie sam przeprowadzam badania i za każdym razem, gdy możesz polegać na dużych przykładowych narzędziach, sprawy stają się znacznie łatwiejsze. Prawa wielkich liczb, twierdzenia o konwergencji Martingale'a itp. Są dobrym narzędziem do uzyskania wyników asymptotycznych, ale nie pomagają przy próbkach skończonych. Wierzę, że coś podobnego jest wspomniane w Hayashi (2000): Econometrics.

c) Jeżeli estymatory są tendencyjne dla małych próbek, można potencjalnie poprawić lub przynajmniej poprawić za pomocą tak zwanych korekt małych próbek. Te są często skomplikowane teoretycznie (aby udowodnić, że poprawiają estymator bez korekty). Co więcej, większość ludzi nie ma nic przeciwko poleganiu na dużych próbkach, więc korekty małych próbek często nie są wdrażane w standardowym oprogramowaniu statystycznym, ponieważ wymaga ich tylko kilka osób (tych, które nie mogą uzyskać więcej danych ORAZ dbać o bezstronność). Istnieją zatem pewne bariery w stosowaniu tych niezwykłych poprawek.

Na twoje pytania. Co rozumiemy przez „dużą próbkę”? Zależy to w dużej mierze od kontekstu, aw przypadku konkretnych narzędzi można na nie odpowiedzieć za pomocą symulacji. Oznacza to, że sztucznie generujesz dane i widzisz, jak powiedzmy, współczynnik odrzucenia zachowuje się jako funkcja wielkości próbki lub obciążenie jest zachowane jako funkcja wielkości próbki. Konkretny przykład jest tutaj , gdzie autorzy widzą, ile klastrów potrzeba, aby standardowe błędy klastrowe OLS, blokowały standardowe błędy rozruchowe itp., Aby dobrze działać. Niektórzy teoretycy mają również stwierdzenia na temat stopnia konwergencji, ale dla celów praktycznych symulacje wydają się bardziej pouczające.

Czy to naprawdę zajmuje ? Jeśli tak mówi teoria, tak, ale w zastosowaniu możemy zaakceptować małe, nieistotne odchylenie, które mamy przy wystarczająco dużych próbkach z dużym prawdopodobieństwem. Co wystarczająco oznacza, zależy od kontekstu, patrz wyżej.n

W przypadku pytania 3: zwykle kwestię bezstronności (dla wszystkich wielkości próby) i spójności (bezstronności dla dużych próbek) rozważa się osobno. Estymator może być stronniczy, ale spójny, w którym to przypadku rzeczywiście tylko szacunki z dużej próby są obiektywne. Ale istnieją również estymatory, które są obiektywne i spójne, które teoretycznie mają zastosowanie do dowolnej wielkości próby. ( Estymator może być również obiektywny, ale niespójny z przyczyn technicznych ).

Bezimienny
źródło