Jakie są przykładowe zastosowania prawdopodobieństwa empirycznego?

28

Słyszałem o prawdopodobieństwie empirycznym Owena, ale do niedawna nie zwracałem na to uwagi, dopóki nie natknąłem się na nie w interesującej pracy ( Mengersen i in. 2012 ).

W moich wysiłków, aby zrozumieć, jakie zebrała, że prawdopodobieństwo obserwowanego danych jest reprezentowana jako , gdzie i p i = 1 oraz p i > 0 .

L=ipi=iP(Xi=x)=iP(Xix)P(Xi<x)
ipi=1pi>0

Nie udało mi się jednak dokonać mentalnego skoku łączącego tę reprezentację z tym, jak można ją wykorzystać do wnioskowania na temat obserwacji. Być może jestem zbyt zakorzeniony w myśleniu o parametrach modelu prawdopodobieństwa wrt?

Niezależnie od tego szukałem w Google Scholar jakiegoś papieru, w którym istnieje prawdopodobieństwo empiryczne, które pomogłoby mi zinternalizować tę koncepcję ... bezskutecznie. Oczywiście jest książka Art Owena na temat empirycznego prawdopodobieństwa , ale Google Books pomija wszystkie pyszne kawałki i wciąż jestem powolny w procesie otrzymywania pożyczki międzybibliotecznej.

W międzyczasie, czy ktoś może uprzejmie wskazać mi dokumenty i dokumenty, które jasno ilustrują przesłankę prawdopodobieństwa empirycznego i sposób jej wykorzystania? Przykładowy opis samego EL byłby również mile widziany!

Sameer
źródło
2
Szczególnie ekonometrycy zakochali się w EL. Jeśli szukasz aplikacji , ta literatura może być jednym z lepszych miejsc do poszukiwania.
kardynał

Odpowiedzi:

17

Nie mogę wymyślić lepszego miejsca niż książka Owena, aby dowiedzieć się o prawdopodobieństwie empirycznym.

L=L(p1,,pn)x1,,xn(p1,,pn)n1/nna każdej z obserwacji (zakładając, że wszystkie są różne). Wymiar przestrzeni parametrów rośnie wraz z liczbą obserwacji.

μp=(p1,,pn)

μ(p)=i=1nxipi,
Lprof(μ)=max{L(p)μ(p)=μ}.
Następnie możemy obliczyć przedziały ufności w postaci pomocą . Tutaj jest średnią empiryczną, a . Przedziały powinny być po prostu nazywane przedziałami prawdopodobieństwa (profilu), ponieważ z góry nie ma oświadczenia o zasięgu. Wraz ze zmniejszaniem przedziały (tak, są to przedziały) tworzą zagnieżdżoną, rosnącą rodzinę przedziałów ufności. Powiedzmy, że można zastosować teorię asymptotyczną lub pasek startowy do kalibracji aby osiągnąć 95% pokrycia.
Ir={μLprof(μ)rLprof(x¯)}
r(0,1)x¯Lprof(x¯)=nnIrrIrr

Książka Owena szczegółowo to omawia i zapewnia rozszerzenie bardziej skomplikowanych problemów statystycznych oraz innych interesujących parametrów.

NRH
źródło
4
(+1) Nie mając dostępu do książki, zawsze można zacząć od oryginalnych prac, aby uzyskać podstawy teorii. Podobnie jak książka, artykuły są również dość wyraźnie napisane.
kardynał
6
Niektóre linki: ( 1 ) A. Owen (1988), Przedziały ufności empirycznego współczynnika wiarygodności dla pojedynczej funkcji , Biometrika , vol. 75, nr 2, str. 237-249, ( 2 ) A. Owen (1990), Regiony ufności dla współczynnika prawdopodobieństwa empirycznego , Ann. Statystyk. , vol. 18, nr 1, pp. 90–120 ( otwarty dostęp ) i ( 3 ) A. Owen (1991) Empiryczne prawdopodobieństwo modeli liniowych , Ann. Statystyk. , vol. 19, nr 4, s. 1725–1747 ( otwarty dostęp ).
kardynał
@cardinal Fantastic! Sam powinienem o tym pomyśleć.
Sameer,
@NHS Dziękujemy za wyjaśnienie! Dla jasności, to WRT w „s? Czy możesz również wyjaśnić, dlaczego ? Czy to może być ? Lprof(μ)argmaxpLprof(x¯)=nnin1=nn
Sameer
@Sameer, literówka jest teraz poprawiana. Jednak to nie argmax. Jest to prawdopodobieństwo profilu uzyskane przez maksymalizację prawdopodobieństwa dla wszystkich wektorów parametrów o danej wartości . Przy okazji z odpowiednim dostępem do uniwersytetu uzyskałem wersję elektroniczną z CRC poszczególnych rozdziałów książki Owena. μ
NRH
15

W ekonometrii wiele zastosowanych artykułów zaczyna się od założenia, że gdzie jest wektorem danych, jest znanym układem równań , a jest nieznanym parametrem . Funkcja pochodzi z modelu ekonomicznego. Celem jest oszacowanie .

E[g(X,θ)]=0
XgqθΘRpqpgθ

Tradycyjne podejście, w ekonometrii, do szacowania i wnioskowania na temat polega na zastosowaniu ogólnej metody momentów: gdzie jest dodatnią, określoną macierzą ważenia, a Dostawcy prawdopodobieństwa empirycznego stanowią alternatywę dla GMM. Chodzi o to, aby wymusić warunek momentu jako ograniczenie przy maksymalizacji prawdopodobieństwa nieparametrycznego. Najpierw napraw a . Następnie rozwiąż zastrzeżeniem θ

θ^GMM=argminθΘg¯n(θ)Wg¯n(θ)
W
g¯n(θ):=1ni=1ng(Xi,θ).
θ
L(θ)=maxp1,,pni=1npi
i=1npi=1,pi0,i=1npig(Xi,θ)=0.
To jest `wewnętrzna pętla „. Następnie zmaksymalizuj ponad : Wykazano, że takie podejście ma lepsze właściwości wyższego rzędu niż GMM (patrz Newey i Smith 2004, Econometrica ), co jest jednym z powodów, dla których jest ono lepsze niż GMM. Dodatkowe informacje można znaleźć w notatkach i wykładzie Imbens i Wooldridge tutaj (wykład 15).θ
θ^EL=argmaxθΘlogL(θ).

Istnieje oczywiście wiele innych powodów, dla których EL zwrócił uwagę w ekonometrii, ale mam nadzieję, że jest to przydatne miejsce początkowe. Modele równości momentów są bardzo powszechne w ekonomii empirycznej.

Aelmore
źródło
Dziękujemy za napisanie tak klarownej, dobrze uzasadnionej odpowiedzi. Witamy w naszej społeczności!
whuber
7

W analizie przeżycia krzywa Kaplana-Meiera jest najbardziej znanym nieparametrycznym estymatorem funkcji przeżycia , gdzie oznacza losową zmienną czasu do zdarzenia. Zasadniczo jest uogólnieniem funkcji rozkładu empirycznego, która umożliwia cenzurę. Można go wyprowadzić heurystycznie, jak podano w większości praktycznych podręczników. Ale można go również formalnie wyprowadzić jako estymator największego prawdopodobieństwa (empiryczny). Oto więcej szczegółów .S(t)=Pr(T>t)TS^

ocram
źródło