Dlaczego zmienne losowe są zdefiniowane jako funkcje?

21

Mam problem ze zrozumieniem pojęcia zmiennej losowej jako funkcji. Rozumiem mechanikę (tak myślę), ale nie rozumiem motywacji ...

Powiedzmy (Ω,B,P) jest potrójnym prawdopodobieństwem, gdzie Ω=[0,1] , B oznacza Borel- σ -algebra w tym przedziale, a P jest regularną miarą Lebesgue'a. Niech X jest zmienną losową z B do {1,2,3,4,5,6} tak, że X([0,1/6))=1 ,X([1/6,2/6))=2 , ...,X([5/6,1])=6 , toX ma dyskretny rozkład jednolity o wartości od 1 do 6.

To wszystko dobrze, ale nie rozumiem konieczności pierwotnego potrójnego prawdopodobieństwa ... moglibyśmy bezpośrednio skonstruować coś równoważnego jako ({1,2),3),4,5,6},S.,P.x) gdzie jest wszystkie odpowiednie -algebra przestrzeni, a jest miarą, która przypisuje do każdego podzbioru miarę (# elementów) / 6. Również wybór był arbitralny - mógł to być lub dowolny inny zestaw.σ P x Ω = [ 0 , 1 ] [ 0 , 2 ]S.σP.xΩ=[0,1][0,2)]

Moje pytanie brzmi: po co zawracać sobie głowę budowaniem arbitralnego za pomocą -algebry i miary i definiować zmienną losową jako mapę od -algebry do rzeczywistej linii? σ σΩσσ

Leo Vasquez
źródło
5
Należy zauważyć, że zmienna losowa jest funkcją z do R , a nie od B do R . Warunkiem jest, że zmienna losowa jest mierzalna względem B . ΩRBRb
mpiktas

Odpowiedzi:

21

Jeśli zastanawiasz się, dlaczego cała ta maszyna jest używana, gdy może wystarczyć coś znacznie prostszego - masz rację w większości typowych sytuacji. Jednak teoretyczna miara prawdopodobieństwa została opracowana przez Kołmogorowa w celu ustanowienia teorii o takiej ogólności, która w niektórych przypadkach mogłaby obsłużyć bardzo abstrakcyjne i skomplikowane przestrzenie prawdopodobieństwa. W rzeczywistości, teoretyczne podstawy pomiaru prawdopodobieństwa Kołmogorowa ostatecznie pozwoliły na zastosowanie narzędzi probabilistycznych daleko poza ich pierwotną zamierzoną dziedziną zastosowania w obszarach takich jak analiza harmoniczna.

Na początku wydaje się, że łatwiej jest pominąć „leżącą u podstaw” -algebrę Ω i po prostu przypisać masy prawdopodobieństwa do zdarzeń składających się bezpośrednio na przestrzeń próbki, jak zaproponowałeś. Rzeczywiście, probabiliści skutecznie robią to samo, ilekroć zdecydują się pracować z „miarą indukowaną” na przestrzeni próbki zdefiniowanej przez P X - 1 . Jednak sprawy zaczynają się komplikować, gdy zaczniesz wchodzić w nieskończone przestrzenie wymiarowe. Załóżmy, że chcesz udowodnić mocne prawo wielkich liczb w konkretnym przypadku rzutu monetami uczciwymi (to znaczy, że proporcja głów dąży arbitralnie do 1/2, gdy liczba rzutów monet spada do nieskończoności). Możesz spróbować zbudować σσΩP.X-1σ-algebra na zestawie nieskończonych sekwencji formie . Ale tutaj można stwierdzić, że znacznie wygodniej jest przyjąć podstawową przestrzeń na Ω = [ 0 , 1 ) ; a następnie użyj binarnych reprezentacji liczb rzeczywistych (np. 0,10100 ... ), aby przedstawić sekwencje rzutów monetą (1 to główki, 0 to ogony.) Ilustrację tego samego przykładu można znaleźć w kilku pierwszych rozdziałach prawdopodobieństwa Billingsleya i zmierzyć .(H.,T.,H.,...)Ω=[0,1)0,10100 ...

charles.y.zheng
źródło
Dzięki! Sprawdzę tę książkę. Ponieważ jednak jest nadal dowolne ( w twoim przykładzie równie dobrze może to być [ 0 , 2 ) , to przedział jednostkowy [ 0 , 1 ] lub [ 0 , 1 ) to „preferowana” przestrzeń, która będzie działać w każdych okolicznościach ? Czy istnieją sytuacje, w których bardziej skomplikowane Ω , jak R 2 byłoby korzystne? Ω[0,2)[0,1][0,1)ΩR2)
Leo Vasquez
2
@Leo: Tak. Przykładem są procesy stochastyczne w ciągłym czasie. Kanonicznym przykładem jest ruch Browna, w którym za próbkę przyjmuje się C , przestrzeń wszystkich ciągłych funkcji o wartościach rzeczywistych. Ωdo
kardynał
1
@NRH, Tak, powinienem powiedzieć, że można wziąć zamiast zabrać . Próbowałem (nieco celowo) szczotkować to pod dywanikiem.
kardynał
1
@cardinal, w komentarzu @ Leo zapytano, czy jest „preferowany” w każdych okolicznościach. Mówię tylko, że IMO nie ma takiego Ω i że dobrze jest nie wymagać niczego w ogóle o Ω . Jeśli chcesz pracować z konkretnym przykładem, mogą istnieć powody, aby wybrać jeden konkretny Ω . Należy jednak zauważyć, że pod dywanami rozciąga się „tautologia”, że należy ustalić istnienie ruchu Browna jako miary prawdopodobieństwa C. [0,1]ΩΩΩdo
NRH
2
@NRH, przepraszam za dzisiaj moją powolność umysłu. Nie udało mi się połączyć preferowanego odniesienia z poprzednim komentarzem @ Leo. Dzięki. Jeśli chodzi o uwagę „tautologii”, miałem na myśli to, że w innych konstrukcjach, jako ciągłość ścieżek próbek jest twierdzeniem , podczas gdy w konstrukcji opartej na z mapą tożsamości jest tautologiczna. Oczywiście najpierw należy pokazać fakt, że BM można zbudować w ten sposób. Ale to trochę poza tym. do
kardynał
10

Kwestie dotyczące -algebr są matematycznymi subtelnościami, które tak naprawdę nie wyjaśniają, dlaczego lub czy potrzebujemy przestrzeni tła . Rzeczywiście powiedziałbym, że nie ma przekonujących dowodów na to, że przestrzeń w tle jest koniecznością. Dla każdej konfiguracji probabilistyczny ( E , E , μ ) , gdzie E jest przykładowy przestrzeń, E σ -algebra i μ miarą prawdopodobieństwa, zainteresowanie jest w ľ , i nie ma powodu, streszczenie, że chcemy μ będzie miarą obraz mierzalnej mapy X : ( Ω , Bσ(mi,mi,μ)mimiσμμμ .X:(Ω,b)(mi,mi)

Jednak użycie abstrakcyjnej przestrzeni w tle zapewnia matematyczną wygodę , dzięki czemu wiele wyników wydaje się bardziej naturalnych i intuicyjnych. Celem jest zawsze powiedzieć coś o , na dystrybucję z X , ale może to być łatwiejsze i bardziej jasno wyrażone X .μXX

Przykład podaje centralne twierdzenie graniczne. Jeśli są wyodrębnione ze średniej wartości μ i wariancji σ 2, CLT mówi, że P ( X1,,Xnμσ2) gdzieΦjest funkcją rozkładu standardowego rozkładu normalnego. Jeżeli rozkładXiwynosiμ,odpowiadający wynik pod względem miary brzmi ρ

P(nσ(1ni=1nXiξ)x)Φ(x)
ΦXiμ Potrzebne jest wyjaśnienie terminologii. Przezμnrozumiemyn-razy splotμ(rozkład sumy). Funkcjeρcsą funkcjami liniowymiρc(x)=cxi
ρn/στξρ1/n(μn)((,x])Φ(x)
μnnμρcρc(x)=cx jest tłumaczeniem τ ξ ( x ) = x - ξ . Prawdopodobnie można się przyzwyczaić do drugiego sformułowania, ale dobrze ukrywa, o co w tym wszystkim chodzi.τξτξ(x)=xξ

Wydaje się, że problemem jest to, że transformacje arytmetyczne biorące udział w CLT są dość wyraźnie wyrażone za pomocą zmiennych losowych, ale nie przekładają się tak dobrze pod względem miar.

NRH
źródło
(+1) Dobry opis. Myślę, że innym powodem, dla którego poprzednia notacja jest tak popularna, jest to, że w bardziej naturalny sposób przekłada się na intuicyjne pojęcia w aplikacjach. (
kardynał
@ kardynał, dzięki za wyjaśnienie tej kwestii. Bardziej naturalne wydaje się myślenie i argumentowanie w kategoriach sumy zmiennych, a nie splotu miar prawdopodobieństwa, i chcielibyśmy, aby matematyka to odzwierciedlała.
NRH
0

Dopiero niedawno natknąłem się na ten nowy sposób myślenia o zmiennej losowej a także o przestrzeni tła Ω . Nie jestem pewien, czy jest to pytanie, którego szukałeś, ponieważ nie jest to powód matematyczny, ale myślę, że zapewnia to bardzo fajny sposób myślenia o RV.XΩ

Wyobraź sobie sytuację, w której rzucamy monetą. Ta konfiguracja eksperymentalna składa się z zestawu możliwych warunków początkowych, które obejmują fizyczny opis sposobu wrzucania monety. Przestrzeń tła składa się ze wszystkich możliwych warunków początkowych. Dla uproszczenia możemy założyć, że rzuty monetą różnią się jedynie prędkością, wówczas ustawiamy Ω=[0,vmax]

Zmienną losową można następnie traktować jako funkcję, która odwzorowuje każdy stan początkowy ω Ω z odpowiednim wynikiem eksperymentu, tj. Czy jest to ogon, czy głowa.XωΩ

Dla RV: miara Q odpowiadałaby wówczas do miary prawdopodobieństwa w warunkach początkowych, która wraz z dynamiką eksperymentu reprezentowaną przez XX:([0,vmax],B[0,vmax],Q)({0,1},2{0,1})QX określa rozkład prawdopodobieństwa wyników.

Aby zapoznać się z tym pomysłem, zobacz rozdziały Tima Maudlina lub Micheala Strevensa w „Probabilties in Physics” (2011)

Sebastian
źródło