Funkcje niezależnych zmiennych losowych

25

Czy twierdzenie, że funkcje niezależnych zmiennych losowych są same w sobie niezależne, prawda?

Widziałem ten wynik często używany pośrednio w niektórych dowodach, na przykład w dowodzie niezależności między średnią próbki a wariancją próby rozkładu normalnego, ale nie byłem w stanie znaleźć uzasadnienia. Wydaje się, że niektórzy autorzy uważają to za dane, ale nie jestem pewien, czy tak jest zawsze.

JohnK
źródło

Odpowiedzi:

33

Najbardziej ogólny i abstrakcyjny definicję niezależności sprawia, że to stwierdzenie banalne podczas dostarczania ważny warunek kwalifikacyjny: że dwie zmienne losowe są niezależne oznacza sigma-algebry one generują są niezależne. Ponieważ sigma-algebra generowana przez mierzalną funkcję sigma-algebry jest subalgebrą, tym bardziej wszelkie mierzalne funkcje tych zmiennych losowych mają niezależne algebry, stąd funkcje te są niezależne.

(Gdy funkcja nie jest mierzalna, zwykle nie tworzy nowej zmiennej losowej, więc koncepcja niezależności nawet by nie miała zastosowania).


Rozpakujmy definicje, aby zobaczyć, jakie to proste. Przypomnijmy, że zmienna losowa X jest funkcją o wartościach rzeczywistych zdefiniowaną w „przestrzeni próbki” Ω (zbiór wyników badanych za pomocą prawdopodobieństwa).

  1. Zmienna losowa X jest badana na podstawie prawdopodobieństwa, że ​​jej wartość mieści się w różnych przedziałach liczb rzeczywistych (lub, bardziej ogólnie, zbiorów zbudowanych w prosty sposób poza przedziałami: są to mierzalne zestawy liczb rzeczywistych Borela).

  2. Odpowiadająca każdej Borel mierzalnym jest wydarzeniem X * ( I ), składający się z wszystkimi wynikami Ohm , dla których X ( Ohm ) leży w I .I X(I)ωX(ω)I

  3. Sigma-algebra wygenerowana przez jest określona przez zbiór wszystkich takich zdarzeń.X

  4. Naiwna definicja mówi, że dwie losowe zmienne i Yniezależne „gdy ich prawdopodobieństwa się mnożą”. To znaczy, kiedy jestem jednym zestawem mierzalnym Borela, a J jest innymXYIJ

    Pr(X(ω)I and Y(ω)J)=Pr(X(ω)I)Pr(Y(ω)J).

  5. Ale w języku zdarzeń (i algebr sigma) jest to to samo co

    Pr(ωX(I) and ωY(J))=Pr(ωX(I))Pr(ωY(J)).

Rozważmy teraz dwie funkcje i załóżmy, że f X a g Y są zmiennymi losowymi. (Okrąg jest kompozycją funkcjonalną: ( f X ) ( ω ) = f ( X ( ω ) ) . To właśnie oznacza, że f jest „funkcją zmiennej losowej”.) Uwaga - to tylko elementarne teoria mnogości - tof,g:RRfXgY(fX)(ω)=f(X(ω))f

(fX)(I)=X(f(I)).

Innymi słowy, każde zdarzenie wygenerowane przez (które znajduje się po lewej stronie) jest automatycznie zdarzeniem wygenerowanym przez XfXX (pokazanym przez formę po prawej stronie). Dlatego (5) automatycznie obowiązuje dla i g Y : nie ma nic do sprawdzenia!fXgY


Uwaga: Możesz „wszędzie” o wartości rzeczywistej zastąpić „wartościami w ” bez potrzeby zmiany czegokolwiek innego w jakikolwiek istotny sposób. Dotyczy to przypadku zmiennych losowych o wartości wektorowej.Rd

Whuber
źródło
1
Algebry Sigma to rzeczy zaawansowane (na poziomie absolwenta).
Aksakal
3
@Aksakal To zależy od szkoły, do której chodzisz lub książek, które czytasz. (Z powodzeniem uczyłem tego materiału na poziomie licencjackim drugiego roku. Istnieją również wspaniale dostępne relacje z tej teorii na poziomie licencjackim, takie jak teksty Stevena Shreve'a o rachunku stochastycznym, które są adresowane do studentów posiadających jedynie rachunek różniczkowy). Ale jak to ma znaczenie? Każde uzasadnienie - nawet wyrafinowane - powinno być preferowane zamiast nieuzasadnionego twierdzenia.
whuber
1
Bardzo miło jest zadać sobie tyle trudu, aby pomóc komuś, kto zadał pytanie. Dzięki jeszcze raz. I masz rację, definicje wcale nie są zbyt zniechęcające.
JohnK,
13

Rozważ ten „mniej zaawansowany” dowód:

Niech , gdzie X , Y są niezależnymi zmiennymi losowymi, a f , g są funkcjami mierzalnymi. Następnie: P { f ( x ) x  i  g ( Y ) X:ΩXRn,Y:ΩYRm,f:RnRk,g:RmRpX,Yf,g Używając niezależności X i Y , P ( { X { w R n : f ( w

P{f(X)x and g(Y)y}=P({f(X)x}{g(Y)y})=P({X{wRn:f(w)x}}{Y{wRm:g(w)y}}).
XY
P({X{wRn:f(w)x}}{Y{wRm:g(w)y}})==P{X{wRn:f(w)x}P{Y{wRm:g(w)y}}=P{f(X)x}P{g(Y)y}.

Chodzi o to, aby zauważyć, że zbiór więc właściwości poprawne dla X są rozszerzone na f ( X ) i to samo dzieje się dla

{f(X)x}{wΩX:f(X(w))x}={X{wRn:f(w)x}},
Xf(X) .Y
Guilherme Salomé
źródło
2
+1. Dziękuję za ten wkład, który tak wyraźnie koncentruje się na zasadniczej idei. Witamy na naszej stronie!
whuber
7

sol(X) i h(Y) są niezależne od jakichkolwiek funkcji sol i h tak długo aż X i Ysą niezależne. To bardzo dobrze znane wyniki, które badane są na kursach teorii prawdopodobieństwa. Jestem pewien, że znajdziesz go w dowolnym standardowym tekście, takim jak Billingsley.

Aksakal
źródło
Dzięki, obecnie studiuję Hogg & Craig i MGB. Billingsley to kolejny logiczny krok.
JohnK,
3
Billinglsey to tortura, chyba że jesteś matematykiem i nie studiowałeś już środków. Partarathy za wstęp jest znacznie łatwiejsze książka 2-w-1, Alan Karr za Prawdopodobieństwo tekst jest również łatwy do odczytu.
Aksakal
Kolejny łatwiejszy tekst niż tekst Billingsleya: probability.ca/jeff/grprobbook.html
Adrian
0

Nie jako alternatywa, ale jako dodatek do poprzednich genialnych odpowiedzi, zauważ, że ten wynik jest w rzeczywistości bardzo intuicyjny.

Zwykle tak myślimy X i Y niezależność oznacza, że ​​znając wartość X nie podaje informacji o wartości Yi wzajemnie. Ta interpretacja oczywiście oznacza, że ​​nie można w jakiś sposób „wycisnąć” informacji przez zastosowanie funkcji (lub w jakikolwiek inny sposób).

Alexis
źródło