W mojej klasie prawdopodobieństwa ciągle stosowane są terminy „sumy zmiennych losowych”. Jednak utknąłem na tym, co to dokładnie oznacza?
Czy mówimy o sumie wielu realizacji z zmiennej losowej? Jeśli tak, to czy to nie stanowi pojedynczej liczby? W jaki sposób suma realizacji zmiennych losowych prowadzi nas do dystrybucji lub jakiejkolwiek funkcji cdf / pdf /? A jeśli nie są to realizacje zmiennych losowych, to co dokładnie jest dodawane?
Odpowiedzi:
Fizyczny, intuicyjny model zmiennej losowej polega na zapisaniu nazwiska każdego członka populacji na jednej lub kilku kartkach papieru - „biletach” - i umieszczeniu tych biletów w pudełku. Proces dokładnego wymieszania zawartości pudełka, a następnie ślepe wyciągnięcie jednego biletu - dokładnie tak, jak w loterii - modeluje losowość. Niejednorodne prawdopodobieństwa są modelowane poprzez wprowadzenie zmiennej liczby biletów w pudełku: więcej biletów dla bardziej prawdopodobnych członków, mniej dla mniej prawdopodobnych.
Zmienna losowa jest numer przyporządkowany każdemu członkowi społeczeństwa. (Dlatego, dla zachowania spójności, każdy bilet dla danego członka musi mieć zapisany ten sam numer.) Wiele zmiennych losowych modelowanych jest przez rezerwowanie spacji na biletach dla więcej niż jednej liczby. Zwykle dają tych przestrzeni nazw, takich jak Y , i Z . Suma tych zmiennych losowych jest zwykle suma: Zastrzegamy nową przestrzeń na każdym bilecie na sumę, odczytać wartości X , Y , itp na każdym bilecie i pisać ich sumę w tej nowej przestrzeni. Jest to spójny sposób zapisywania liczb na biletach, więc jest to kolejna zmienna losowa.X, Y, Z X, Y,
Ta figura przedstawia okno reprezentujący populacji i trzech zmiennych losowych X , Y i X + Y . Zawiera sześć biletów: trzy dla alfa (niebieski), daje to prawdopodobieństwo 3 / 6 , dwa dla P (żółty) daje to prawdopodobieństwo 2 / 6 , a także jeden z y (zielony) daje to prawdopodobieństwo 1 / 6Ω={α,β,γ} X Y X+Y α 3/6 β 2/6 γ 1/6 . Aby wyświetlić to, co jest napisane na biletach, są one wyświetlane przed zmiksowaniem.
Piękno tego podejścia polega na tym, że wszystkie paradoksalne części pytania okazują się prawidłowe:
suma zmiennych losowych jest rzeczywiście pojedynczą, określoną liczbą (dla każdego członka populacji),
ale prowadzi to również do rozkładu (podanego przez częstotliwości, z którymi suma pojawia się w ramce), i
nadal skutecznie modeluje losowy proces (ponieważ bilety są nadal ślepo wyciągane z pudełka).
W ten sposób suma może jednocześnie mieć określoną wartość (określoną przez reguły dodawania stosowane do liczb na każdym z biletów), a realizacja - która będzie biletem wyciągniętym ze skrzynki - nie będzie miała wartości do jest przeprowadzane.
Ten fizyczny model losowania biletów ze skrzynki jest przyjęty w literaturze teoretycznej i zaostrzony z definicjami przestrzeni próbki (populacji), algebry sigma (wraz z powiązanymi miarami prawdopodobieństwa) i zmiennych losowych jako funkcji mierzalnych zdefiniowanych w przestrzeni próbki .
To konto zmiennych losowych jest opracowane, z realistycznymi przykładami, w „Co oznacza zmienna losowa?” .
źródło
za tym wyrażeniem nie kryje się żadna tajemnica, jest to tak proste, jak myślisz: jeśli X i Y są dwiema losowymi zmiennymi, ich suma to X + Y, a ta suma jest również zmienną losową. Jeśli X_1, X_2, X_3, ..., X_n i są n losowymi zmiennymi, ich suma to X_1 + X_2 + X_3 + ... + X_n i ta suma jest również zmienną losową (a realizacja tej sumy jest pojedyncza liczba, a mianowicie suma n realizacji).
Dlaczego tak dużo mówisz o sumach zmiennych losowych w klasie? Jednym z powodów jest (niesamowite) centralne twierdzenie o granicy: jeśli zsumujemy wiele niezależnych zmiennych losowych, wówczas możemy „przewidzieć” rozkład tej sumy (prawie) niezależnie od rozkładu pojedynczych zmiennych w sumie! Suma ta staje się rozkładem normalnym i jest to prawdopodobny powód, dla którego tak często obserwujemy rozkład normalny w świecie rzeczywistym.
źródło
rv to relacja między wystąpieniem zdarzenia a liczbą rzeczywistą. Powiedzmy, że jeśli pada deszcz, wartość X wynosi 1, a jeśli nie, to 0. Możesz mieć kolejne rv Y równe 10, gdy jest zimno, i 100, gdy jest gorąco. Jeśli więc pada deszcz i jest zimno, X = 1, Y = 10, a X + Y = 11.
Wartości X + Y wynoszą 10 (nie pada zimno); 11 (pada deszcz, zimno), 100 (pada deszcz, gorąco) i 110 (pada deszcz, gorąco). Jeśli obliczysz nasze prawdopodobieństwa wydarzeń, dostaniesz PMF tego nowego rv X + Y.
źródło
Żadna z tych odpowiedzi nie daje matematycznie rygorystycznego sposobu myślenia o sumie zmiennej losowej. Zauważ, żeX, Y nie musi być zdefiniowany w tej samej domenie wyników, a nawet jeśli tak, X+ Y nie może być rozumiane jako sumowanie dwóch funkcji. Zamiast tego należy je najpierw rozszerzyć na domenęΩ1× Ω2) . Na przykład letX, Y być identyczną funkcją Ω = { He a d, Ti L } gdzie X( He a d) = Y( He a d) = 1 , X( Ta i l ) = Y( Ta i l ) = 0 . Domena( X+ Y) powinno być {(głowa, ogon), (ogon, głowa), (głowa, głowa), (ogon, ogon)}. TerazX, Y są funkcjami w tej przestrzeni produktu, gdzie ich wartość jest określona wyłącznie przez 1. i 2. współrzędną. Suma ta może być teraz rozumiana jako suma funkcji jako zwykły sens. Zauważ również, żeσ- pole i miara prawdopodobieństwa również powinny zostać zdefiniowane od nowa. PowiedzenieX, Y są niezależne, to jeden ze sposobów określenia miary produktu.
źródło