Mam cztery niezależne, równomiernie rozmieszczone zmienne , każda w . Chcę obliczyć rozkład . rozkład na (stąd ), a aby być Teraz rozkład sumy u_1 + u_2 wynosi ( u_1, \, u_2 są również niezależne) f_ {u_1 + u_2} (x) = \ int _ {- \ infty} ^ {+ \ infty} f_1 (xy) f_2 (y) dy = - \ frac {1} {4} \ int_0 ^ 4 \ frac {1- \ sqrt {xy}} {\ sqrt {xy}} \ cdot \ ln \ frac {y} {4} dy, bo y \ in (0,4]
Zrobiłem cztery niezależne zbiory składające się z liczb i narysowałem histogram :
i narysował wykres :
Zasadniczo wykres jest podobny do histogramu, ale w przedziale większość z nich jest ujemna (pierwiastek wynosi 2,27034). Całka części dodatniej wynosi .
Gdzie jest błąd? Lub gdzie coś mi brakuje?
EDYCJA: Przeskalowałem histogram, aby wyświetlić plik PDF.
EDYCJA 2: Myślę, że wiem, gdzie jest problem w moim rozumowaniu - w granicach integracji. Ponieważ i , nie mogę po prostu . Wykres pokazuje region, w którym muszę się zintegrować:x - y ∈ ( 0 , 1 ] ∫ x 0
Oznacza to, że mam dla (dlatego część mojego była poprawna), in i in . Niestety Mathematica nie oblicza dwóch ostatnich całek (cóż, oblicza drugą, ponieważ w wyniku znajduje się wyimaginowana jednostka, która psuje wszystko ... ). lat ∈ ( 0 , 1 ] f ∫ x x - 1 rok ∈ ( 1 , 4 ] ∫ 4 x - 1 rok ∈ ( 4 , 5 )
EDYCJA 3: Wygląda na to, że Mathematica MOŻE obliczyć trzy ostatnie całki za pomocą następującego kodu:
(1/4)*Integrate[((1-Sqrt[u1-u2])*Log[4/u2])/Sqrt[u1-u2],{u2,0,u1},
Assumptions ->0 <= u2 <= u1 && u1 > 0]
(1/4)*Integrate[((1-Sqrt[u1-u2])*Log[4/u2])/Sqrt[u1-u2],{u2,u1-1,u1},
Assumptions -> 1 <= u2 <= 3 && u1 > 0]
(1/4)*Integrate[((1-Sqrt[u1-u2])*Log[4/u2])/Sqrt[u1-u2],{u2,u1-1,4},
Assumptions -> 4 <= u2 <= 4 && u1 > 0]
co daje poprawną odpowiedź :)
źródło
Odpowiedzi:
Często pomaga korzystać z funkcji dystrybucji skumulowanej.
Pierwszy,
Kolejny,
Niech zawierać się między najmniejszą ( ) a największą ( ) możliwą wartością . Zapisując z CDF i z PDF , musimy obliczyćδ 0 5 (a−d)2+4bc x=(a−d)2 F y=4bc g=G′
Można się spodziewać, że będzie to nieprzyjemne - jednolity rozkład pliku PDF jest nieciągły i dlatego powinien powodować przerwy w definicji więc jest to dość niesamowite, że Mathematica uzyskuje formę zamkniętą (której nie będę tutaj reprodukować). Zróżnicowanie go względem daje pożądaną gęstość. Jest on definiowany fragmentarycznie w trzech odstępach czasu. W ,H δ 0<δ<1
W ,1<δ<4
I w ,4<δ<5
Ta liczba nakłada wykres na histogramie iid realizacji . Oba są prawie nie do odróżnienia, co sugeruje poprawność wzoru na .h 106 (a−d)2+4bc h
Poniżej znajduje się prawie bezmyślne rozwiązanie Mathematica o brutalnej sile . Automatyzuje praktycznie wszystko w obliczeniach. Na przykład obliczy nawet zakres wynikowej zmiennej:
Oto cała integracja i zróżnicowanie. (Bądź cierpliwy; obliczenie zajmuje kilka minut.)H
Na koniec symulacja i porównanie z wykresem :h
źródło
Podobnie jak OP i whuber, użyłbym niezależności, aby rozbić to na prostsze problemy:
Niech . Zatem pdf , powiedzmy to:X=(a−d)2 X f(x)
Niech . Zatem pdf , powiedzmy to:Y=4bc Y g(y)
Problem sprowadza się do znalezienia się wersję . Może być na to wiele sposobów, ale najprostszym dla mnie jest użycie funkcji wywoływanej z bieżącej wersji rozwojowej mathStatica . Niestety nie jest to obecnie dostępne w publicznym wydaniu, ale oto dane wejściowe:X+Y
TransformSum
który zwraca pdf jako funkcję częściową:Z=X+Y
Oto wykres właśnie pobranego pliku pdf, powiedzmy :h(z)
Szybkie sprawdzenie Monte Carlo
Poniższy diagram porównuje empiryczne przybliżenie Monte Carlo pdf (squiggly niebieski) z teoretycznym pdf wyprowadzonym powyżej (czerwony przerywany). Wygląda w porządku.
źródło