Czy ktoś może wyjaśnić pojęcie „sumy zmiennych losowych”

21

W mojej klasie prawdopodobieństwa ciągle stosowane są terminy „sumy zmiennych losowych”. Jednak utknąłem na tym, co to dokładnie oznacza?

Czy mówimy o sumie wielu realizacji z zmiennej losowej? Jeśli tak, to czy to nie stanowi pojedynczej liczby? W jaki sposób suma realizacji zmiennych losowych prowadzi nas do dystrybucji lub jakiejkolwiek funkcji cdf / pdf /? A jeśli nie są to realizacje zmiennych losowych, to co dokładnie jest dodawane?

Gosset
źródło
1
Przez „realizacje zmiennej losowej” zakładam, że masz na myśli rzeczywiste obserwowane wartości. To, co jest sumowane w „sumie zmiennych losowych”, to zmienne losowe, zanim zostaną zaobserwowane. Wyobraź sobie obliczanie masy kolejnych 5 osób, które wsiądą do windy. Nie znasz (jeszcze) ich ciężarów, więc każdy z nich jest zmienną losową. Ale prawdopodobnie chciałbyś wiedzieć coś o rozkładzie sumy ich wag.
PeterR
@PeterR Tego nie rozumiem. Jak to w ogóle ma sens mówić o dodawaniu czegoś, co nie ma jeszcze wartości? Czy to metaforyczny rodzaj sumowania?
Gosset
1
Myślę, że twoim problemem jest to, że nie rozumiesz, co jest zmienną losową. Jeśli dostaniesz tę koncepcję, wówczas suma też będzie łatwa.
Aksakal
@Aksakal Czy to, że już opublikowałem to pytanie, nie jest tego dowodem? Być może, jeśli go znasz, możesz wyjaśnić tę koncepcję?
Gosset
Podano świetne odpowiedzi. Innym przykładem jest sumą dwóch kości, . Wynik jest wyraźnie losowy (nie wiesz z góry, jaka będzie suma obu kości). Wiemy, że X , Y U n i f ( 1 , 6 ) i niezależne. Okazuje się, że X + Y ma rozkład trójkątny. X+YX,YUnjafa(1,6)X+Y
bdeonovic

Odpowiedzi:

39

Fizyczny, intuicyjny model zmiennej losowej polega na zapisaniu nazwiska każdego członka populacji na jednej lub kilku kartkach papieru - „biletach” - i umieszczeniu tych biletów w pudełku. Proces dokładnego wymieszania zawartości pudełka, a następnie ślepe wyciągnięcie jednego biletu - dokładnie tak, jak w loterii - modeluje losowość. Niejednorodne prawdopodobieństwa są modelowane poprzez wprowadzenie zmiennej liczby biletów w pudełku: więcej biletów dla bardziej prawdopodobnych członków, mniej dla mniej prawdopodobnych.

Zmienna losowa jest numer przyporządkowany każdemu członkowi społeczeństwa. (Dlatego, dla zachowania spójności, każdy bilet dla danego członka musi mieć zapisany ten sam numer.) Wiele zmiennych losowych modelowanych jest przez rezerwowanie spacji na biletach dla więcej niż jednej liczby. Zwykle dają tych przestrzeni nazw, takich jak Y , i Z . Suma tych zmiennych losowych jest zwykle suma: Zastrzegamy nową przestrzeń na każdym bilecie na sumę, odczytać wartości X , Y , itp na każdym bilecie i pisać ich sumę w tej nowej przestrzeni. Jest to spójny sposób zapisywania liczb na biletach, więc jest to kolejna zmienna losowa.X, Y,ZX, Y,

Postać

Ta figura przedstawia okno reprezentujący populacji i trzech zmiennych losowych X , Y i X + Y . Zawiera sześć biletów: trzy dla alfa (niebieski), daje to prawdopodobieństwo 3 / 6 , dwa dla P (żółty) daje to prawdopodobieństwo 2 / 6 , a także jeden z y (zielony) daje to prawdopodobieństwo 1 / 6Ω={α,β,γ}XYX+Yα3/6β2/6γ1/6. Aby wyświetlić to, co jest napisane na biletach, są one wyświetlane przed zmiksowaniem.

Piękno tego podejścia polega na tym, że wszystkie paradoksalne części pytania okazują się prawidłowe:

  • suma zmiennych losowych jest rzeczywiście pojedynczą, określoną liczbą (dla każdego członka populacji),

  • ale prowadzi to również do rozkładu (podanego przez częstotliwości, z którymi suma pojawia się w ramce), i

  • nadal skutecznie modeluje losowy proces (ponieważ bilety są nadal ślepo wyciągane z pudełka).

W ten sposób suma może jednocześnie mieć określoną wartość (określoną przez reguły dodawania stosowane do liczb na każdym z biletów), a realizacja - która będzie biletem wyciągniętym ze skrzynki - nie będzie miała wartości do jest przeprowadzane.

Ten fizyczny model losowania biletów ze skrzynki jest przyjęty w literaturze teoretycznej i zaostrzony z definicjami przestrzeni próbki (populacji), algebry sigma (wraz z powiązanymi miarami prawdopodobieństwa) i zmiennych losowych jako funkcji mierzalnych zdefiniowanych w przestrzeni próbki .

To konto zmiennych losowych jest opracowane, z realistycznymi przykładami, w „Co oznacza zmienna losowa?” .

Whuber
źródło
3
+1 przykładowy post. Mam nadzieję, że nie przeszkadza ci impertynenckie pytanie, ale w jaki sposób wykonano ilustrację?
Glen_b
4
@Glen_b PowerPoint :-). Zdjęcie pudełka pochodzi z mymiddlec.files.wordpress.com/2013/09/empty-box.jpg . Bilety są grafiką PowerPoint. (W takich pytaniach nie ma nic impertynentalnego!) Zgrupowałem całą grupę, wkleiłem ją w programie Paint i użyłem do zapisania jej jako pliku .png.
whuber
Coś mi brakuje, ale wygląda na to, że piszesz wiele etykiet numerycznych na każdym członku populacji. Wszystkie alfy mają X = 1, Y = 2, a zatem X + Y = 3 .. X, Y i X + Y mają dokładnie taki sam rozkład, przesunięty o tu wartość, z powodu różnych wartości
MiloMinderbinder
1
@ whuber - powinien mieć zapisane częstotliwości. Słabo zorientowany w żargonach matematycznych, by powiedzieć „podstawowa miara prawdopodobieństwa”. w każdym razie dostajesz mój dryf. Zaczynam widzieć, jak mogę się bawić liczbami na biletach, aby uzyskać pożądany rozkład prawdopodobieństwa. Na pobieżnym poziomie takie podejście wydawało się po prostu grą słów z różnymi „etykietami” i dlatego nie było wyraźnie widoczne. to byłby 50 raz, kiedy pomogłeś mi na tej stronie. dziękuję
MiloMinderbinder
1
@Milo Nie ma za co. Widzę teraz, że zareagowałeś na przykład w tej odpowiedzi, a nie na przykład podany w poprzednich komentarzach. Przykład odpowiedzi rzeczywiście ma trzy różne bilety o częstotliwościach względnych 1: 2: 3, i to wszystko, co w tym przypadku oznacza „miara prawdopodobieństwa”. Nie jest to jednak tylko żargon: istnieje ogromna potrzeba podstawowych koncepcji. Zobacz między innymi stats.stackexchange.com/questions/199280 , aby uzyskać fajne konta.
whuber
4

za tym wyrażeniem nie kryje się żadna tajemnica, jest to tak proste, jak myślisz: jeśli X i Y są dwiema losowymi zmiennymi, ich suma to X + Y, a ta suma jest również zmienną losową. Jeśli X_1, X_2, X_3, ..., X_n i są n losowymi zmiennymi, ich suma to X_1 + X_2 + X_3 + ... + X_n i ta suma jest również zmienną losową (a realizacja tej sumy jest pojedyncza liczba, a mianowicie suma n realizacji).

Dlaczego tak dużo mówisz o sumach zmiennych losowych w klasie? Jednym z powodów jest (niesamowite) centralne twierdzenie o granicy: jeśli zsumujemy wiele niezależnych zmiennych losowych, wówczas możemy „przewidzieć” rozkład tej sumy (prawie) niezależnie od rozkładu pojedynczych zmiennych w sumie! Suma ta staje się rozkładem normalnym i jest to prawdopodobny powód, dla którego tak często obserwujemy rozkład normalny w świecie rzeczywistym.

Jolvi
źródło
3

rv to relacja między wystąpieniem zdarzenia a liczbą rzeczywistą. Powiedzmy, że jeśli pada deszcz, wartość X wynosi 1, a jeśli nie, to 0. Możesz mieć kolejne rv Y równe 10, gdy jest zimno, i 100, gdy jest gorąco. Jeśli więc pada deszcz i jest zimno, X = 1, Y = 10, a X + Y = 11.

Wartości X + Y wynoszą 10 (nie pada zimno); 11 (pada deszcz, zimno), 100 (pada deszcz, gorąco) i 110 (pada deszcz, gorąco). Jeśli obliczysz nasze prawdopodobieństwa wydarzeń, dostaniesz PMF tego nowego rv X + Y.

Aksakal
źródło
1

Żadna z tych odpowiedzi nie daje matematycznie rygorystycznego sposobu myślenia o sumie zmiennej losowej. Zauważ, żeX,Y nie musi być zdefiniowany w tej samej domenie wyników, a nawet jeśli tak, X+Ynie może być rozumiane jako sumowanie dwóch funkcji. Zamiast tego należy je najpierw rozszerzyć na domenęΩ1×Ω2). Na przykład letX,Y być identyczną funkcją Ω={H.mizare,T.zajal} gdzie X(H.mizare)=Y(H.mizare)=1,X(T.zajal)=Y(T.zajal)=0. Domena(X+Y)powinno być {(głowa, ogon), (ogon, głowa), (głowa, głowa), (ogon, ogon)}. TerazX,Ysą funkcjami w tej przestrzeni produktu, gdzie ich wartość jest określona wyłącznie przez 1. i 2. współrzędną. Suma ta może być teraz rozumiana jako suma funkcji jako zwykły sens. Zauważ również, żeσ-pole i miara prawdopodobieństwa również powinny zostać zdefiniowane od nowa. PowiedzenieX,Y są niezależne, to jeden ze sposobów określenia miary produktu.

Daniel Li
źródło