Rozwiązanie do ćwiczenia 2.2a.16 „Solidnych statystyk: podejście oparte na funkcjach wpływu”

9

Na stronie 180 szczegółowych statystyk: Podejście oparte na funkcjach wpływu można znaleźć następujące pytanie:

  • 16: Pokaż, że zawsze dla estymatorów niezmienniczych dla lokalizacji ε12. Znajdź odpowiednią górną granicę w punkcie podziału próby skończonejεn, zarówno w przypadku, gdy n jest nieparzysty lub n jest parzysty.

Druga część (po kropce) jest właściwie trywialna (biorąc pod uwagę pierwszą), ale nie mogę znaleźć sposobu na udowodnienie pierwszej części (zdania) pytania.

W części książki dotyczącej tego pytania znajduje się (str. 98):

Definicja 2: Punkt podziału próby skończonej εn estymatora Tn na próbce (xl,,xn) jest dany przez:

εn(Tn;xi,,xn):=1nmax{m:maxi1,,imsupy1,,ym|Tn(z1,,zn)|<}

gdzie próbka (z1,,zn) jest uzyskiwana przez zastąpienie m punktów danych xi1,,xim dowolnymi wartościami y1,,ym.

Formalna definicja samego ε działa na prawie stronie, ale można go traktować jako

ε=limnεn
Chociaż nie jest wyraźnie zdefiniowany, jeden może zgadnąć, że niezmiennik lokalizacji oznacza, że Tn musi spełniać
Tn(x1,,xn)=Tn(x1+c,,xn+c), for all cR

Ja (próbuję) odpowiedzieć na pytanie Whubera w komentarzu poniżej. Książka określa estymator ma kilka stron, poczynając od str. 82, staram się odtworzyć główne części (myślę, że odpowie na pytanie Whubera):Tn

Załóżmy, że mamy obserwacje jednowymiarowe które są niezależne i identycznie rozmieszczone (iid). Obserwacje należą do pewnej przykładowej przestrzeni , która jest podzbiorem rzeczywistej linii (często po prostu równa się samej , więc obserwacje mogą przyjmować dowolną wartość ). Model parametryczny składa się z rodziny rozkładów prawdopodobieństwa , w przestrzeni próbki, gdzie nieznany parametr należy do jakiejś przestrzeni parametrów(X1,,Xn)HRHRFθθΘ

...

Identyfikujemy próbkę z jej rozkładem empirycznym , ignorując sekwencję obserwacji (jak prawie zawsze się to robi). Formalnie jest wyrażony przez gdzie , masa pkt 1 . Jako estymatory bierzemy pod uwagę statystyki o wartościach rzeczywistych . W szerszym sensie estymator może być postrzegany jako sekwencja statystyk , po jednej dla każdej możliwej wielkości próby . Idealnie, obserwacje są przedstawione zgodnie z członkiem modelu parametrycznego (X1,,Xn)GnGn(1/n)i=1nΔxiΔXXθTn=Tn(X1,,Xn)=Tn(Gn){Tn,n1}n{Fθ;θΘ} , ale klasa wszystkich możliwych rozkładów prawdopodobieństwa na jest znacznie większa.F(H)H

Rozważamy estymatory, które są funkcjonałami [tj. dla wszystkich i ] lub mogą być asymptotycznie zastąpione funkcjami. Oznacza to, że zakładamy, że istnieje funkcjonalny [gdzie domena jest zbiorem wszystkich dystrybucji dla którego zdefiniowano ], tak że prawdopodobne, gdy obserwacje są zgodne z rzeczywistym rozkładem w . Mówimy, żeTn(Gn)=T(Gn)nGnT:domain(T)RTF(H)T

Tn(X1,,Xn)nT(G)
Gdomain(T)T(G)jest asymptotyczna wartość o .{Tn;n1}G

...

W tym rozdziale zawsze zakładamy, że badane funkcjonały są spójne z Fisherem (Kallianpur i Rao, 1955): co oznacza, że model estymatora asymptotycznie mierzy odpowiednią ilość. Pojęcie spójności Fishera jest bardziej odpowiednie i eleganckie dla funkcjonałów niż zwykła spójność lub asymptotyczna bezstronność.

T(Fθ)=θ for all θΘ
{Tn;n1}

użytkownik603
źródło
1
Jak dokładnie ta książka definiuje „estymator”? Wydaje mi się, że każdy ograniczony estymator musi mieć punkt podziału , więc na pewno nakłada on pewne specjalne ograniczenia na ; i zawsze istnieją ograniczone estymatory niezmiennicze lokalizacji (będą obejmowały stałe). Tn1Tn
whuber
1
Dziękujemy za rozwinięty materiał. Nadal wydaje się, że istnieje wiele kontrprzykładów. Prostym jest estymator stały dla jednoparametrowej rodziny rozkładów normalnych wariancji . Jest to niezmienny estymator wariancji. Punkt podziału wynosi . Jest spójny z Fisherem (trywialnie), ale muszę ostrożnie interpretować definicję: „ ” niekoniecznie musi odnosić się do wszystkich parametrów, ponieważ wówczas żaden estymator niezmiennik lokalizacji nie mógłby być spójny! Tn(X1,,Xn)=111θ
whuber
@whuber: Dzięki, rozumiem twój kontrprzykład. Myślę, że skontaktuję się z autorem i poproszę o więcej informacji ...
user603

Odpowiedzi:

4

W starszych książkach statystycznych użyto „niezmiennika” w nieco inny sposób niż można by się spodziewać; niejednoznaczna terminologia się utrzymuje. Nowocześniejszym odpowiednikiem jest „ekwiwariant” (patrz odniesienia na końcu tego postu). W obecnym kontekście oznacza to

Tn(X1+c,X2+c,,Xn+c)=Tn(X1,X2,,Xn)+c

dla wszystkich prawdziwych .c

Aby odpowiedzieć na to pytanie, załóżmy, że ma właściwość, która dla wystarczająco dużych , wszystkich rzeczywistych i wszystkich ,Tnncmεn

|Tn(X+Y)Tn(X)|=o(|c|)

ilekroć różni się od najwyżej we współrzędnych co najwyżej .YXcm

(Jest to warunek słabszy niż zakładano w definicji granicy podziału. W rzeczywistości wszystko, co naprawdę musimy założyć, to że gdy jest wystarczająco duże, wyrażenie „ ” ma pewną wartość gwarantowaną mniejszą niż )no(|c|)|c|/2

Dowodem jest sprzeczność. Załóżmy odpowiednio, że ten jest również równoważny i załóżmy, że . Zatem dla odpowiednio dużego , jest liczbą całkowitą, dla której zarówno i . Dla dowolnych liczb rzeczywistych zdefiniujTnε>1/2nm(n)=εnm(n)/nε(nm(n))/nεa,b

tn(a,b)=Tn(a,a,,a, b,b,,b)

gdy istnieją 'S ' S. Zmieniając lub mniej współrzędnych, wnioskujemy obam(n) anm(n) bm(n)

|t(a,b)t(0,b)|=o(|a|)

i

|t(a,b)t(a,0)|=o(|b|).

Dla zapewnia się nierówność trójkątac>0

c=|tn(c,c)tn(0,0)||tn(c,c)tn(c,0)|+|tn(c,0)tn(0,0)|=o(c)+o(c)<c/2+c/2=c

Ścisła nierówność na przedostatniej linii jest zapewniona dla wystarczająco dużego . Sprzeczność, którą implikuje, , dowodzinc<cε1/2.


Bibliografia

EL Lehmann, Teoria szacowania punktów . John Wiley 1983.

W tekście (rozdział 3, sekcja 1) i towarzyszącym przypisie pisze Lehmann

Estymator spełniający dla wszystkich będzie nazywany ekwiwariantem ...δ(X1+a,,Xn+a)=δ(X1,,Xn)+aa

Niektórzy autorzy nazywają takie estymatory „niezmiennikiem”. Ponieważ sugeruje to, że estymator pozostaje niezmieniony pod , wydaje , że lepiej zarezerwować ten termin dla funkcji spełniających dla wszystkich .Xi=Xi+au(x+a)=u(x)x,a

Whuber
źródło
1
tak, skontaktowałem się wczoraj z głównym autorem książki z tym samym pytaniem o faktyczną definicję użytej niezmienniczości (zajrzałem do indeksu i nie mogłem znaleźć go wyraźnie w książce). Głosowałem za tym, ponieważ uważam, że twoja odpowiedź jest prawidłowa, ale da autorowi kilka dni na upewnienie się przed zaakceptowaniem.
user603
1
Nie otrzymałem odpowiedzi od autora, ale argumenty przedstawione powyżej (w odpowiedzi i komentarzu) przekonały mnie, że rzeczywiście musi to być prawidłowa interpretacja problemu.
user603