Dla jakiego problemu lub gry optymalne są wariancja i odchylenie standardowe?

9

Dla danej zmiennej losowej (lub populacji, lub procesu stochastycznego) oczekiwanie matematyczne jest odpowiedzią na pytanie: Która prognoza punktowa minimalizuje oczekiwaną stratę kwadratową? . Jest to również optymalne rozwiązanie dla gry. Zgadnij, kiedy zrealizujesz losową zmienną (lub nowe losowanie z populacji), a ja ukarzę cię kwadratową odległością między wartością a twoim zgadnięciem, jeśli masz liniową nieporozumienie kary. Mediana jest odpowiedzią na odpowiadające pytanie przy całkowitej stracie, a tryb jest odpowiedzią pod stratą „wszystko albo nic”.

Pytania: Czy wariancja i odchylenie standardowe odpowiadają na podobne pytania? Czym oni są?

Motywacja tego pytania wynika z nauczania podstawowych miar tendencji centralnej i rozprzestrzeniania się. Podczas gdy miary tendencji centralnej mogą być motywowane powyższymi problemami teoretycznymi, zastanawiam się, jak można zmotywować miary rozprzestrzeniania się.

Richard Hardy
źródło
1
Bardzo interesujące pytanie. Moje początkowe podejście byłoby takie, że „gra” jest jakościowo taka sama, jak to, co już opisałeś, z tym wyjątkiem, że pytanie oczekuje (żadna gra słów nie jest zamierzona), że odpowiedź będzie dotyczyła zakresu wartości zamiast jednego punktu, ponieważ rozprzestrzeniła się bez punktu odniesienie jest raczej niekompletną (jeśli nie bez znaczenia) informacją.
Emil
Zauważ, że wariancja sama w sobie jest oczekiwaniem - jeśli to . Y=(Xμ)2Var(X)=E(Y)
Glen_b
@Glen_b, masz rację i zrozumiałem (powinienem to uwzględnić w tekście pytania). „Odgadnij różnicę między następną wartością a oczekiwaniami, a ja ukarzę cię kwadratowo” będzie gra. Czy to jest najlepsze? IMHO nie brzmi bardzo praktycznie ani nie sprawia przyjemności.
Richard Hardy,

Odpowiedzi:

2

Jeśli zrozumiałem pytanie zgodnie z zamierzeniami, masz na myśli ustawienie, w którym możesz uzyskać niezależne realizacje dowolnej zmiennej losowej o dowolnym rozkładzie (posiadającym skończoną wariancję ). „Gry” określa się na podstawie funkcji i , który zostanie opisany. Składa się z następujących kroków i zasad:XFσ2(F)hL

  1. Twój przeciwnik („Natura”) ujawniaF.

  2. W odpowiedzi tworzysz liczbę swoją „prognozę”.t(F),

Aby ocenić wynik gry, wykonuje się następujące obliczenia:

  • Próbkę iid obserwacji pochodzi znX=X1,X2,,XnF.

  • Z góry określona funkcja jest stosowana do próbki, tworząc liczbę „statystykę”.hh(X),

  • „Funkcja straty” porównuje twoje „przewidywanie” ze statystyką tworząc liczbę nieujemnąLt(F)h(X),L(t(F),h(X)).

  • Wynikiem gry jest oczekiwana strata (lub „ryzyko”)

    R(L,h)(t,F)=E(L(t(F),h(X))).

Twoim celem jest zareagowanie na ruch Natury poprzez określenie które minimalizuje ryzyko.t

Na przykład w grze z funkcją i każdą utratą formy dla pewnej liczby dodatniej twoim optymalnym ruchem jest wybrać jako oczekiwanie nah(X1)=X1L(t,h)=λ(th)2λ,t(F)F.

Pytanie przed nami brzmi:

Może istnieją i dla których optymalny ruch jest wybranie za odchylenie ?Lht(F)σ2(F)

Łatwo na to odpowiedzieć, pokazując wariancję jako oczekiwanie. Jednym ze sposobów jest ustalenie, że i kontynuowanie korzystania z straty kwadratowej Po zaobserwowaniu tego

h(X1,X2)=12(X1X2)2
L(t,h)=(th)2.

E(h(X))=σ2(F),

przykład pozwala nam dojść do wniosku, że ten i ten odpowiadają na pytanie dotyczące wariancji.hL


Co z odchyleniem standardowym ? Ponownie musimy to tylko przedstawić jako oczekiwanie na przykładową statystykę. Nie jest to jednak możliwe, ponieważ nawet jeśli ograniczymy do rodziny rozkładów Bernoulliego , możemy uzyskać tylko obiektywne estymatory funkcji wielomianowych ale nie jest funkcją wielomianową w domenie (Zobacz Ogólny argument dotyczący rozkładów dwumianowych, dla którego nie istnieje obiektywny estymator dla ? , dla którego to pytanie można zmniejszyć po uśrednieniuσ(F)F(p)p,σ(F)=p(1p)p(0,1).1/phwe wszystkich permutacjach)Xi.

Whuber
źródło
Dziękuję za wyraźne sformułowanie mojego pytania i równie jasną odpowiedź. Czy miałbyś również przykład który zależy od wszystkich punktów próbki, a nie tylko dwóch? hn
Richard Hardy,
2
Istnieje standardowy sposób przejścia z na : obliczenie statystyki dla wszystkich par i średniej. Rzeczywiście, to daje moją charakterystykę kowariancji na stats.stackexchange.com/a/18200/919 . Dla formalnej teorii to, przeczytać o statystyki U . 2n
whuber
1
Dziękuję Ci bardzo!
Richard Hardy