Jaka jest różnica między wariancją skończoną a nieskończoną? Moja wiedza na temat statystyk jest raczej podstawowa; Wikipedia / Google niewiele tu pomogło.
variance
intuition
partial-moments
AfterWorkGuinness
źródło
źródło
Odpowiedzi:
Niech będzie ciągłą zmienną losową (RV) (nasze wnioski będą obowiązywały bardziej ogólnie, dla przypadku dyskretnego zamień całkę na sumę). Aby uprościć ekspozycję, załóżmy, że .X ≥ 0X X≥ 0
Oczekiwania zdefiniowane są przez całkę gdy ta całka istnieje, to znaczy jest skończona. W przeciwnym razie mówimy, że oczekiwanie nie istnieje. Jest to niepoprawna całka i z definicji jest to Aby ograniczenie było skończone, wkład z ogona musi zniknąć, to znaczy musimy mieć Warunek konieczny (ale niewystarczający), aby tak się stało is . Powyżej pokazany warunek mówi, że wkład w oczekiwanie na (prawy) ogon musi zniknąć∫ ∞ 0 x f ( x )
W wielu sytuacjach wydaje się to nierealne. Powiedzmy, że jest to model ubezpieczenia (na życie), więc modeluje okres życia (człowieka). Wiemy, że powiedzmy, że nie występuje, ale w praktyce używamy modeli bez górnej granicy. Powód jest jasny: No trudno górna granica wiadomo, czy dana osoba jest (powiedzmy) 110 lat, nie ma powodu, że nie może żyć jeszcze jeden rok! Model z twardą górną granicą wydaje się więc sztuczny. Nadal nie chcemy, aby ekstremalny górny ogon miał duży wpływ.X > 1000X X> 1000
Jeśli ma skończone oczekiwania, możemy zmienić model, aby mieć twardą górną granicę bez niepożądanego wpływu na model. W sytuacjach z rozmytą górną granicą, która wydaje się dobra. Jeśli model ma nieskończone oczekiwania, każda twarda górna granica, którą wprowadzimy do modelu, będzie miała dramatyczne konsekwencje! To jest prawdziwe znaczenie nieskończonych oczekiwań.X
Mając skończone oczekiwania, możemy mieć wątpliwości co do górnych granic. Z nieskończonymi oczekiwaniami nie możemy .
Teraz to samo można powiedzieć o nieskończonej wariancji, mutatis mutandi.
Aby to wyjaśnić, zobaczmy na przykładzie. W tym przykładzie wykorzystujemy rozkład Pareto, zaimplementowany w pakiecie R (na CRAN) aktuar jako pareto1 --- jednoparametrowy rozkład Pareto znany również jako rozkład Pareto typu 1. Posiada funkcję gęstości prawdopodobieństwa podaną przez dla niektórych parametrów . Gdy oczekiwanie istnieje i podaje je . Kiedy oczekiwanie nie istnieje, lub, jak mówimy, jest nieskończone, ponieważ całka definiująca je rozchodzi się w nieskończoność. Możemy zdefiniować rozkład w pierwszej chwilim>0,α>0α>1α
Gdy oczekiwanie istnieje ( ), możemy go podzielić, aby uzyskać względny rozkład pierwszego momentu, podany przez Gdy jest tylko trochę większy niż jeden, więc oczekiwanie „ledwo istnieje”, całka definiująca oczekiwanie będzie się powoli zbiegać. Spójrzmy na przykład z . Wykreślmy zatem za pomocą R:E r ( M ) = E ( m ) / E ( ∞ ) = 1 - ( mα>1
który produkuje tę działkę:
Na przykład z tego wykresu można przeczytać, że około 50% udziału w oczekiwaniach pochodzi z obserwacji powyżej około 40. Biorąc pod uwagę, że oczekiwanie tego rozkładu wynosi 6, to jest zdumiewające! (ten rozkład nie ma istniejącej wariancji. W tym celu potrzebujemy ).μ α > 2
Zdefiniowana powyżej funkcja Er_inv jest odwrotnym względnym rozkładem pierwszego momentu, analogiem do funkcji kwantylu. Mamy:
To pokazuje, że 50% udziału w oczekiwaniach pochodzi z górnej 1,5% ogona rozkładu! Tak więc, szczególnie w małych próbkach, w których istnieje duże prawdopodobieństwo, że skrajny ogon nie jest reprezentowany, średnia arytmetyczna, choć wciąż jest obiektywnym estymatorem oczekiwań , musi mieć bardzo skośny rozkład. Zbadamy to poprzez symulację: Najpierw używamy wielkości próbki .μ n = 5
Aby uzyskać czytelny wykres, pokazujemy histogram tylko dla części próbki o wartościach poniżej 100, co stanowi bardzo dużą część próbki.
Rozkład średnich arytmetycznych jest bardzo przekrzywiony,
prawie 86% średnich empirycznych jest mniejszych lub równych średniej teoretycznej - oczekiwaniu. Tego należy się spodziewać, ponieważ większość wkładu w średnią pochodzi z ekstremalnego górnego ogona, który nie jest reprezentowany w większości próbek .
Musimy wrócić do ponownej oceny naszych wcześniejszych wniosków. Chociaż istnienie środka umożliwia rozmywanie w zakresie górnych granic, widzimy, że kiedy „środek po prostu ledwo istnieje”, co oznacza, że całka powoli zbieżna, nie możemy być tak rozmyślni w kwestii górnych granic . Powolnie zbieżne całki powodują, że lepiej byłoby zastosować metody, które nie zakładają istnienia oczekiwań . Kiedy całka bardzo powoli zbiega się, dzieje się tak, jakby wcale się nie zbiegała. Praktyczne korzyści wynikające ze zbieżnej całki to chimera w wolno zbieżnym przypadku! To jeden ze sposobów na zrozumienie wniosku NN Taleb w http://fooledbyrandomness.com/complexityAugust-06.pdf
źródło
Wariancja jest miarą rozproszenia rozkładu wartości zmiennej losowej. Nie jest to jedyna taka miara, np. Średnie bezwzględne odchylenie jest jedną z alternatyw.
Nieskończona wariancja oznacza, że wartości losowe nie koncentrują się zbytnio wokół średniej . Może to oznaczać, że istnieje wystarczająco duże prawdopodobieństwo, że następna losowa liczba będzie bardzo daleko od średniej.
Rozkłady takie jak Normalny (Gaussa) mogą wytwarzać liczby losowe bardzo daleko od średniej, ale prawdopodobieństwo takich zdarzeń maleje bardzo gwałtownie wraz ze skalą odchylenia.
W związku z tym, gdy spojrzysz na wykres rozkładu Cauchy'ego lub Gaussa (normalny) rozkład, nie wyglądają one bardzo różnie wizualnie. Jeśli jednak spróbujesz obliczyć wariancję rozkładu Cauchy'ego, będzie ona nieskończona, podczas gdy rozkład Gaussa jest skończony. Tak więc rozkład normalny jest ściślejszy wokół jego średniej w porównaniu do rozkładu Cauchy'ego.
Przy okazji, jeśli porozmawiasz z matematykami, będą nalegać, że rozkład Cauchy'ego nie ma dobrze określonego środka, że jest nieskończony. To brzmi absurdalnie dla fizyków, którzy zwracają uwagę na fakt, że Cauchy jest symetryczny, a zatem musi mieć jakiś sens. W takim przypadku twierdzą, że problem dotyczy twojej definicji średniej, a nie rozkładu Cauchyego.
źródło
Alternatywnym sposobem patrzenia jest funkcja kwantyli.
Następnie możemy obliczyć moment lub oczekiwanie
Krzywe na obrazie pokazują, ile każdy kwantyl bierze udział w obliczeniach.
Ta nieskończoność może nie być tak dziwna, ponieważ sama całka odległość (średnia) lub odległość kwadratowa (wariancja) mogą stać się nieskończone. To tylko pytanie, ile waży , ile procent F ma te nieskończone ogony.
W sumowaniu / całkowaniu odległości od zera (średnia) lub do kwadratu odległość od średniej (wariancja) pojedynczy punkt, który jest bardzo daleko, będzie miał większy wpływ na średnią odległość (lub odległość do kwadratu) niż wiele punktów w pobliżu.
Kiedy więc zbliżamy się do nieskończoności, gęstość może się zmniejszyć, ale wpływ na sumę pewnej (rosnącej) ilości, np. Odległości lub odległości w kwadracie, niekoniecznie się zmienia.
źródło
źródło