Dlaczego funkcja skumulowanej dystrybucji (CDF) jednoznacznie definiuje rozkład?

17

Zawsze mówiono mi, że CDF jest wyjątkowy, jednak PDF / PMF nie jest wyjątkowy, dlaczego? Czy możesz podać przykład, w którym plik PDF / PMF nie jest unikalny?

DKangeyan
źródło
6
Jeśli chodzi o wyjątkowość, możesz zastanowić się nad różnicą między PDF jednolitego rozkładu na a jednolitym rozkładem na jego wnętrzu, . Innym zabawnym ćwiczeniem - które dotyczy pytania, czy plik PDF w ogóle istnieje - jest zastanowienie się, jak wyglądałby plik PDF z rozkładem liczb wymiernych. Na przykład, niech za każdym razem, gdy , i \ ge 1 , a j jest nieparzyste. [0,1](0,1)Pr(j2i)=212i0<j2i<1i1j
whuber
2
Nie wszystkie dystrybucje mają nawet pliki PDF lub PMF, podczas gdy patrzenie na CDF daje jednoczący widok rzeczy. Zmienne ciągłe mają gładko wyglądające CDF, zmienne dyskretne mają „schody”, a niektóre CDF są mieszane.
Silverfish,
6
@Silverfish: ... a niektóre z nich nie są żadnymi z powyższych! :-)
kardynał
3
Aby zająć się tytułem (być może nieco luźno), CDF definiuje rozkład, ponieważ CDF (lub równoważnie tylko DF / „funkcja dystrybucji”; „C” działa tylko w celu wyjaśnienia, że ​​o tym mówimy) jest tym terminem „dystrybucja” dosłownie odnosi się do; „D” jest wskazówką w tej części. To, że jest unikalne, wynika z „F” - funkcje są jednowartościowe, więc jeśli dwie funkcje rozkładu są identyczne, obiekt, który definiują, jest taki sam; gdyby DF różniły się gdziekolwiek, to, czym są, byłyby w tych punktach różne. Czy to tautologia? Myślę, że to jest.
Glen_b
4
@Glen_b Jest tautologiczny tylko dla wyszkolonej intuicji. Funkcja rozkładu podaje tylko prawdopodobieństwa postaci podczas gdy cała dystrybucja określa prawdopodobieństwo postaci dla dowolnych mierzalnych zestawów Musisz pokazać, że określa rozkład. Jak zauważa NicholasB, jest to kwestia przedłużenia pomiaru wstępnego z pół-pierścienia (półotwartych przedziałów), , do pełnego pola sigma Lebesgue'a i pokazanie, że jest wyjątkowyF ( x ) = Pr { ω ΩFPr ( { ω ΩF(x)=Pr{ωΩ|X(ω)x}BR F μ ( ( a , b ] ) = F ( b ) - F ( a )Pr({ωΩ|X(ω)B}BRFμ((a,b])=F(b)F(a)
whuber

Odpowiedzi:

13

Przypomnijmy kilka rzeczy. Niech (Ω,A,P) będzie przestrzeń prawdopodobieństwo , Ω jest nasz przykładowy zestaw, jest nasz σ -algebra, a P jest funkcją prawdopodobieństwa określona na A . Zmienna losowa jest mierzalna Funkcja X : Ohm R tj X - 1 ( S ) dla każdego podzbioru w Lebesgue'a mierzalne RAσPAX:ΩRX1(S)AR. Jeśli nie znasz tej koncepcji, wszystko, co powiem później, nie będzie miało sensu.

Ilekroć mamy zmienną losową, X:ΩR , indukuje ona miarę prawdopodobieństwa na przez kategoryczne przesunięcie w przód. Innymi słowy, . Sprawdzenie, czy jest miarą prawdopodobieństwa na jest proste . Nazywamy na dystrybucję z X .R X ( S ) = P ( X - 1 ( S ) ) X R X XRX(S)=P(X1(S))XRXX

Z tą koncepcją wiąże się coś, co nazywa się funkcją rozkładu zmiennej funkcyjnej. Biorąc pod uwagę zmienną losową X:ΩR definiujemy F(x)=P(Xx) . Funkcje dystrybucyjne F:R[0,1] mają następujące właściwości:

  1. F jestciągłe w prawo.

  2. F nie maleje

  3. i F ( - ) = 0 .F()=1F()=0

Wyraźnie losowe zmienne, które są równe, mają ten sam rozkład i funkcję rozkładu.

Odwrócenie procesu i uzyskanie pomiaru za pomocą danej funkcji rozkładu jest dość techniczne. Powiedzmy, że otrzymujesz funkcję dystrybucyjną . Zdefiniuj μ ( a , b ] = F ( b ) - F ( a ) . Musisz pokazać, że μ jest miarą na półalgebrze przedziałów ( a , b ) . Następnie możesz zastosować twierdzenie o rozszerzeniu Carathéodory rozszerzyć μ do miary prawdopodobieństwa na badania .F(x)μ(a,b]=F(b)F(a)μ(a,b]μR

Nicolas Bourbaki
źródło
4
Jest to dobry początek odpowiedzi, ale może nieumyślnie przysłonić sprawę. Wydaje się, że głównym problemem jest to, że dwie miary o tej samej funkcji rozkładu są w rzeczywistości równe. Nie wymaga to nic więcej niż twierdzenie - λ Dynkina i fakt, że zestawy formy ( - , b ] tworzą system π, który generuje borel σ -algebrę. Wtedy niejednoznaczność gęstości (zakładając, że istnieje!) Może należy się odnieść do powyższego i skontrastować z nimπλ(,b]πσ
kardynał
3
(Jedna dodatkowa drobna sprzeczka: Zmienne losowe są zwykle definiowane w kategoriach zestawów Borela, a nie zestawów Lebesgue'a). Myślę, że przy niektórych drobnych zmianach odpowiedź ta stanie się całkiem jasna. :-)
kardynał
@ kardynał Najpierw myślę o analizie, a potem o prawdopodobieństwie. Dlatego może to wyjaśniać, dlaczego wolę myśleć o zestawach Lebesgue. W obu przypadkach nie wpływa to na to, co zostało powiedziane.
Nicolas Bourbaki,
4

Aby odpowiedzieć na prośbę o przykład dwóch gęstości z tą samą całką (tj. Mieć tę samą funkcję rozkładu), rozważ te funkcje zdefiniowane na liczbach rzeczywistych:

 f(x) = 1 ; when x is odd integer
 f(x) = exp(-x^2)  ; elsewhere

i wtedy;

 f2(x) = 1  ; when x is even integer
 f2(x) = exp(-x^2) ;  elsewhere

Nie są w ogóle równe x, ale oba są gęstościami dla tego samego rozkładu, dlatego gęstości nie są jednoznacznie określone przez (skumulowany) rozkład. Kiedy gęstości z rzeczywistą domeną różnią się tylko dla policzalnego zestawu wartości x, wówczas całki będą takie same. Analiza matematyczna tak naprawdę nie jest przeznaczona dla osób o słabych nerwach lub o zdecydowanie konkretnym umyśle.

DWin
źródło
0

Nie zgadzam się ze stwierdzeniem: „funkcja rozkładu prawdopodobieństwa nie określa jednoznacznie miary prawdopodobieństwa”, którą wypowiadasz w pytaniu otwierającym. Jedynie to determinuje.

Niech będą dwiema funkcjami masy prawdopodobieństwa. Jeżeli, E f 1 = E f 2 Dla dowolnego mierzalnego zestawu E, wówczas f 1 = f 2 prawie wszędzie. To jednoznacznie determinuje pdf (ponieważ w analizie nie obchodzi nas, czy nie zgadzają się co do zestawu miary zero).f1,f2:R[0,)

Ef1=Ef2
Ef1=f2

Powyższą całkę możemy przepisać na: Gdzie g = f 1 - f 2 jest funkcją całkowitą.

Eg=0
g=f1f2

Zdefiniuj , więc E g = 0 . Używamy dobrze znanego twierdzenia, że ​​jeśli całka funkcji nieujemnej wynosi zero, to funkcja jest prawie wszędzie zerowa. W szczególności, g = 0 AE na E . Tak f 1 = F 2 ae o E . Teraz powtórz argument w innym kierunku, używając F = { x R | g 0 }E={xR | g0}Eg=0g=0Ef1=f2EF={xR | g0}. Będziemy się, że ae na F . Tak więc, F 1 = f 2 i ekspozycję na E F = R .f1=f2Ff1=f2EF=R

Nicolas Bourbaki
źródło