Wiem więc, że jeśli chcemy znaleźć rozkład prawdopodobieństwa sumy niezależnych zmiennych losowych , możemy obliczyć go z rozkładów prawdopodobieństwa i , mówiąc:
Intuicyjnie ma to sens, ponieważ jeśli chcemy znaleźć prawdopodobieństwo, że dwie zmienne losowe sumują się do , jest to w zasadzie suma prawdopodobieństw wszystkich zdarzeń, które prowadzą do zsumowania tych zmiennych do . Ale jak mogę formalnie udowodnić to oświadczenie?
probability
Jessica
źródło
źródło
Odpowiedzi:
Bardziej ogólne rozwiązanie uwzględnia gdzie i niekoniecznie są niezależne. Powszechną strategią rozwiązywania problemów, w których zastanawiasz się, skąd pochodzi plik PDF lub jak go uzasadnić, jest znalezienie skumulowanego prawdopodobnie zamiast tego, a następnie różnicowanie w celu zmniejszenia CDF do formatu PDF.X YZ=X+Y X Y
Łatwo zauważyć, że w takim przypadku gdzie jest regionem płaszczyzny - , dla której .R x y x + y ≤ zFZ(z)=P(Z≤z)=∫∫RfX,Y(x,y)dxdy R x y x+y≤z
Jest to region z kreskowaniem niebieskim na poniższym schemacie. To naturalne, że integracja w tym regionie odbywa się poprzez rozbicie go na paski - zrobiłem to z pionowymi paskami, ale poziome wystarczą. W efekcie uzyskuję pasek dla każdej współrzędnej , w zakresie od do , i wzdłuż każdego paska chcę, aby wartości nie rosły powyżej linii , więc .- ∞ ∞ y x + y = z y ≤ z - xx −∞ ∞ y x+y=z y≤z−x
Teraz, gdy uzyskaliśmy granice całkowania w kategoriach i , możemy dokonać podstawienia , w następujący sposób, w celu uzyskania, aby pojawiło się jako górna granica . Matematyka jest prosta, o ile rozumiesz użycie jakobianu do zmiany zmiennych.y u = x v = x + y z vx y u=x v=x+y z v
Dopóki spełnione są określone warunki, możemy rozróżnić pod znakiem integralnym w odniesieniu do aby uzyskać:z
Działa to nawet wtedy, gdy i nie są niezależne. Ale jeśli tak, możemy przepisać gęstość spoiny jako iloczyn dwóch marginalnych:X Y
W razie potrzeby zmienną fikcyjną można bez szkody zapisać jako .u x
Moje oznaczenie całek jest dokładnie zgodne z rozdziałem 6.4 Geoffrey Grimmett i Dominic Walsh, Prawdopodobieństwo: wprowadzenie , Oxford University Press, Nowy Jork, 2000.
źródło
Stwierdzenie jest prawdziwe wtedy i tylko wtedy, gdy prawa strona działa jak gęstość dla ; to jest,X+Y
dla wszystkich . Sprawdźmy to, zaczynając od prawej strony.a
Zastosuj Twierdzenie Fubiniego, aby zmienić kolejność całkowania i dokonać podstawienia . Wyznacznikiem jego jakobianu jest , więc ta zmiana zmiennych nie wprowadza żadnych dodatkowych terminów. Zauważ, że ponieważ i są w relacji jeden do jednego, a wtedy i tylko wtedy, gdy , możemy przepisać całkę jakoz=x+y 1 z y −∞<z≤a −∞<y<a−x
Z definicji jest to całka z zR2
gdzie jest funkcją wskaźnika zestawu. Wreszcie, ponieważ i są niezależne, dla wszystkich , ujawniając całkę jako jedynie oczekiwanieI X Y f(X,Y)(x,y)=fX(x)fY(y) (x,y)
zgodnie z życzeniem.
Mówiąc bardziej ogólnie, nawet jeśli jeden lub oba lub nie mają funkcji rozkładu, nadal możemy uzyskaćX Y
bezpośrednio z podstawowych definicji, wykorzystując oczekiwanie wskaźników do przechodzenia między prawdopodobieństwami a oczekiwaniami oraz wykorzystując założenie niezależności, aby rozbić obliczenia na osobne oczekiwania w odniesieniu do i :X Y
Obejmuje to na przykład zwykłe wzory na dyskretne zmienne losowe, choć w nieco innej formie niż zwykle (ponieważ jest to wyrażone raczej w kategoriach CDF niż w funkcjach masy prawdopodobieństwa).
Jeśli masz wystarczająco silne twierdzenie o zamianie pochodnych i całek, możesz rozróżnić obie strony względem aby uzyskać gęstość za jednym pociągnięciem,a fX+Y
źródło