Dla danej zmiennej losowej (lub populacji, lub procesu stochastycznego) oczekiwanie matematyczne jest odpowiedzią na pytanie: Która prognoza punktowa minimalizuje oczekiwaną stratę kwadratową? . Jest to również optymalne rozwiązanie dla gry. Zgadnij, kiedy zrealizujesz losową zmienną (lub nowe losowanie z populacji), a ja ukarzę cię kwadratową odległością między wartością a twoim zgadnięciem, jeśli masz liniową nieporozumienie kary. Mediana jest odpowiedzią na odpowiadające pytanie przy całkowitej stracie, a tryb jest odpowiedzią pod stratą „wszystko albo nic”.
Pytania: Czy wariancja i odchylenie standardowe odpowiadają na podobne pytania? Czym oni są?
Motywacja tego pytania wynika z nauczania podstawowych miar tendencji centralnej i rozprzestrzeniania się. Podczas gdy miary tendencji centralnej mogą być motywowane powyższymi problemami teoretycznymi, zastanawiam się, jak można zmotywować miary rozprzestrzeniania się.
źródło
Odpowiedzi:
Jeśli zrozumiałem pytanie zgodnie z zamierzeniami, masz na myśli ustawienie, w którym możesz uzyskać niezależne realizacje dowolnej zmiennej losowej o dowolnym rozkładzie (posiadającym skończoną wariancję ). „Gry” określa się na podstawie funkcji i , który zostanie opisany. Składa się z następujących kroków i zasad:X F σ2(F) h L
Twój przeciwnik („Natura”) ujawniaF.
W odpowiedzi tworzysz liczbę swoją „prognozę”.t(F),
Aby ocenić wynik gry, wykonuje się następujące obliczenia:
Próbkę iid obserwacji pochodzi zn X=X1,X2,…,Xn F.
Z góry określona funkcja jest stosowana do próbki, tworząc liczbę „statystykę”.h h(X),
„Funkcja straty” porównuje twoje „przewidywanie” ze statystyką tworząc liczbę nieujemnąL t(F) h(X), L(t(F),h(X)).
Wynikiem gry jest oczekiwana strata (lub „ryzyko”)R(L,h)(t,F)=E(L(t(F),h(X))).
Twoim celem jest zareagowanie na ruch Natury poprzez określenie które minimalizuje ryzyko.t
Na przykład w grze z funkcją i każdą utratą formy dla pewnej liczby dodatniej twoim optymalnym ruchem jest wybrać jako oczekiwanie nah(X1)=X1 L(t,h)=λ(t−h)2 λ, t(F) F.
Pytanie przed nami brzmi:
Łatwo na to odpowiedzieć, pokazując wariancję jako oczekiwanie. Jednym ze sposobów jest ustalenie, że i kontynuowanie korzystania z straty kwadratowej Po zaobserwowaniu tegoh(X1,X2)=12(X1−X2)2 L(t,h)=(t−h)2.
przykład pozwala nam dojść do wniosku, że ten i ten odpowiadają na pytanie dotyczące wariancji.h L
Co z odchyleniem standardowym ? Ponownie musimy to tylko przedstawić jako oczekiwanie na przykładową statystykę. Nie jest to jednak możliwe, ponieważ nawet jeśli ograniczymy do rodziny rozkładów Bernoulliego , możemy uzyskać tylko obiektywne estymatory funkcji wielomianowych ale nie jest funkcją wielomianową w domenie (Zobacz Ogólny argument dotyczący rozkładów dwumianowych, dla którego nie istnieje obiektywny estymator dla ? , dla którego to pytanie można zmniejszyć po uśrednieniuσ(F) F (p) p, σ(F)=p(1−p)−−−−−−−√ p∈(0,1). 1/p h we wszystkich permutacjach)Xi.
źródło