„Absolutnie ciągła zmienna losowa” vs. „Ciągła zmienna losowa”?

13

W książce „Twierdzenia graniczne teorii prawdopodobieństwa” Walentina V. Pietrowa dostrzegłem rozróżnienie między definicjami rozkładu będącymi „ciągłymi” a „absolutnie ciągłymi”, które są następujące:

"... Rozkład zmiennej losowej X jest ciągły, jeśli P ( X B ) = 0 dla dowolnego skończonego lub policzalnego zbioru B punktów linii rzeczywistej. Mówi się, że jest absolutnie ciągły, jeśli P ( X B ) = 0 dla wszystkich zbiorów Borela B miary Lebesgue'a zero… ”() XP(XB)=0BP(XB)=0B

Znana mi koncepcja to:

„Jeśli zmienna losowa ma ciągłą funkcję skumulowanego rozkładu, to jest ona absolutnie ciągła.”(#)

czy dwa opisy dotyczące „absolutnej ciągłości” w ( ) i ( # ) mówią o tym samym? Jeśli tak, jak mogę przetłumaczyć jedno wyjaśnienie na drugie?My questions are:()(#)

Dziękuję Ci!

Tian
źródło
6
Standardowy przykład ciągłej, ale nie absolutnie ciągłej dystrybucji omówiono na stronie stats.stackexchange.com/questions/229556/... , gdzie jest wykreślany i dostarczany jest kod do pobrania próbki z niego.
whuber

Odpowiedzi:

22

Opisy różnią się: tylko pierwszy () jest poprawny. Ta odpowiedź wyjaśnia, jak i dlaczego.


Ciągłe dystrybucje

„Ciągły” rozkład F jest ciągły w zwykłym znaczeniu funkcji ciągłej . Jedna z definicji (zazwyczaj pierwsza spotykana przez ludzi w ich edukacji) jest taka, że ​​dla każdego x i dla dowolnej liczby ϵ>0 istnieje δ (w zależności od x i ϵ ), dla którego wartości F na δ sąsiedztwie x są różne o nie więcej niż ϵ z F(x) .

Jest to krótki krok od wykazania, że ​​gdy ciągły F jest rozkładem losowej zmiennej X , to Pr(X=x)=0 dla dowolnej liczby x . W końcu definicja ciągłości oznacza, że ​​można zmniejszyć δ aby Pr(X(xδ,x+δ)) tak mała jak dowolna ϵ>0 a ponieważ (1) prawdopodobieństwo to jest nie mniejsze niż Pr(X=x) i (2)ϵ mogą być dowolnie małe, z tego wynika, żePr(X=x)=0 . Policzalny addytywności prawdopodobieństwa rozszerza ten wynik każdej skończonej lub zbiór przeliczalnyB .

Całkowicie ciągłe rozkłady

Wszystkie funkcje rozkładu F określają miary skończone μF określone przez

μF((a,b])=F(b)F(a).

Absolutna ciągłość jest pojęciem teorii miary. Jedną z miar μF jest całkowicie ciągły w odniesieniu do innego środka λ (obu określonych w tym samym przestrzeń mierzalna), gdy dla każdego zbioru mierzalnego E , λ(E)=0 oznacza μF(E)=0 . Innymi słowy, w odniesieniu do λ , nie ma zestawów „małych” (miara zero), do których μF przypisuje „duże” (niezerowe) prawdopodobieństwo.

Przyjmiemy, że λ jest zwykłą miarą Lebesgue'a, dla której λ((a,b])=ba jest długością przedziału. Druga połowa () stanowi, że miara prawdopodobieństwa μF(B)=Pr(XB) jest absolutnie ciągłe w odniesieniu do miary Lebesgue'a.

Absolutna ciągłość wiąże się z różnicowalnością. Pochodna jednej miary względem drugiej (w pewnym momencie x ) jest intuicyjną koncepcją: weź zestaw mierzalnych dzielnic x które zmniejszają się do x i porównaj dwie miary w tych dzielnicach. Jeśli zawsze zbliżają się do tego samego limitu, bez względu na wybraną sekwencję sąsiedztw, wówczas granica ta jest pochodną. (Istnieje problem techniczny: musisz ograniczyć te dzielnice, aby nie miały „patologicznych” kształtów. Można tego dokonać, wymagając od każdej dzielnicy zajmowania nieistotnej części regionu, w którym się znajduje).

Różnicowanie w tym sensie jest właśnie pytaniem w Jaka jest definicja prawdopodobieństwa przy rozkładzie ciągłym? adresuje.

Napiszmy Dλ(μF) dla pochodnej μF względem λ . Odpowiednie twierdzenie - jest to teoretyczna wersja Podstawowego twierdzenia rachunku różniczkowego - twierdzenia

μF jest absolutnie ciągłe w odniesieniu doλ wtedy i tylko wtedy, gdy

μF(E)=E(DλμF)(x)dλ
dla każdego zbioru mierzalnegoE . [Rudin, Twierdzenie 8.6]

Innymi słowy, ciągłość bezwzględna ( μF względem λ ) jest równoważna istnieniu funkcji gęstości Dλ(μF) .

Podsumowanie

  1. Rozkład F jest ciągły, gdy F jest ciągły jako funkcja: intuicyjnie nie ma „skoków”.

  2. Rozkład F jest absolutnie ciągły, gdy ma funkcję gęstości (w odniesieniu do miary Lebesgue'a).

To, że te dwa rodzaje ciągłości nie są równoważne, jest pokazane w przykładach, takich jak ten opisany na https://stats.stackexchange.com/a/229561/919 . Jest to słynna funkcja Cantor . Dla tej funkcji F jest prawie wszędzie poziomo (ponieważ jego wykres jest wyraźny), skąd Dλ(μF) jest prawie wszędzie zerowy, a zatem RDλ(μF)(x)dλ=R0dλ=0. To oczywiście nie daje poprawnej wartości 1 (zgodnie z aksjomatem całkowitego prawdopodobieństwa).

Komentarze

Praktycznie wszystkie rozkłady używane w aplikacjach statystycznych są absolutnie ciągłe, nigdzie ciągłe (dyskretne) lub ich mieszaniny, więc rozróżnienie między ciągłością a ciągłością absolutną jest często ignorowane. Jednak nie docenienie tego rozróżnienia może prowadzić do mętnego rozumowania i złej intuicji, szczególnie w przypadkach, w których rygor jest najbardziej potrzebny: mianowicie, gdy sytuacja jest myląca lub nieintuicyjna, więc polegamy na matematyce, która prowadzi nas do poprawienia wyników. Dlatego zwykle nie robimy dużych rzeczy w praktyce, ale każdy powinien o tym wiedzieć.

Odniesienie

Rudin, Walter. Analiza rzeczywista i złożona . McGraw-Hill, 1974: rozdziały 6.2 (Absolutna ciągłość) i 8.1 (Pochodne miar).

Whuber
źródło
2
W innych aplikacjach obficie kontynuuje się dystrybucje. Jednym z przykładów są (niektóre) układy dynamiczne, w których obfituje podkowa smale, które powodują rozkłady o właściwościach takich jak rozkład Cantora.
kjetil b halvorsen