Dlaczego rozkład rand () ^ 2 jest inny niż rand () * rand ()?

15

W programie Libre Office Calc rand()dostępna jest funkcja, która wybiera losową wartość od 0 do 1 z jednolitego rozkładu. Prawdopodobnie jestem trochę zardzewiały, więc kiedy zobaczyłem następujące zachowanie, byłem zaskoczony:

A = 200 x 1 kolumna z rand()^2

B = 200 x 1 kolumna z rand()*rand()

mean(A) = 1/3

mean(B) = 1/4

Dlaczego jest mean(A)! = 1/4?

Jefftopia
źródło
4
Ponieważ oczekiwanie kwadratu zmiennej losowej nie jest równe kwadratowi jego oczekiwanej wartości.
Michael M
3
Jeśli rand()działa podobnie jak inne podobne operatory, to A to ta sama liczba losowa podniesiona do kwadratu, a B to dwie losowe liczby pomnożone.
Peter Flom - Przywróć Monikę
Rozumiem. Byłbym bardzo pomocny, gdybym mógł zobaczyć przeliterowaną matematykę lub powiązaną z zasobem, który to robi.
Jefftopia,
4
Uproszczenie sytuacji może pomóc ci zrozumieć sens. Załóżmy, że Rand()zostały zastąpione przez Int(2*Rand()): to przyjmuje wartości i z jednakowymi prawdopodobieństwami. Istnieją dwie możliwości jego kwadratu i cztery możliwości iloczynu dwóch (niezależnych) wartości: co się stanie, gdy spełnisz ich oczekiwania? 101
whuber

Odpowiedzi:

24

Pomocne może być myślenie o prostokątach. Wyobraź sobie, że masz szansę zdobyć ziemię za darmo. Rozmiar terenu zostanie określony przez (a) jedną realizację zmiennej losowej lub (b) dwie realizacje tej samej zmiennej losowej. W pierwszym przypadku (a) obszar będzie kwadratem o długości boku równej wartości próbki. W drugim przypadku (b) dwie próbkowane wartości będą reprezentować szerokość i długość prostokąta. Którą alternatywę wybierasz?

Niech będzie realizacją dodatniej zmiennej losowej.U

a) Oczekiwana wartość jednej realizacji określa pole kwadratu równe U 2 . Średnio rozmiar obszaru wyniesie E [ U 2 ]UU2)

mi[U2)]

b) Jeżeli istnieją dwie niezależne realizacje i U 2 , obszar będzie wynosić U 1U 2 . Średnio rozmiar jest równy E [ U 1U 2 ] = E 2 [ U ], ponieważ obie realizacje mają ten sam rozkład i są niezależne.U1U2)U1U2)

mi[U1U2)]=mi2)[U]

Kiedy obliczamy różnicę między wielkością obszarów a) ib), otrzymujemy

mi[U2)]-mi2)[U]

Powyższy termin jest identyczny z który z natury jest większy lub równy 0 .V.zar[U]0

Dotyczy to ogólnego przypadku.

W twoim przykładzie próbkowałeś z rozkładu jednolitego . W związku z tym,U(0,1)

E2[U]=1

E[U]=12)
Var[U]=1
mi2)[U]=14
V.zar[U]=112

E[U2)]=V.zar[U]+mi2)[U]

E[U2]=112+14=13

Wartości te zostały wyprowadzone analitycznie, ale pasują do tych uzyskanych za pomocą generatora liczb losowych.

Sven Hohenstein
źródło
aba2+ab+b23
To sprytne użycie wariancji. I tutaj miałem zamiar bezpośrednio rozwalić matematykę.
Affine
To ma dla mnie sens. Wszystko zależy od tego, czy wariancja jest nieujemna. Ciekaw jestem też, jak John otrzymał odpowiedź.
Jefftopia,
Zasadniczo po prostu podążał za tym, co zrobił Sven, ale zastąpił je formułami dla bardziej ogólnego jednolitego rozkładu.
Jan
E[U2]E[U2]E[U2]E2[U]
10

Nie sugerując, że brakuje doskonałej odpowiedzi Svena, ale chciałem przedstawić stosunkowo elementarne podejście do pytania.

Zastanów się nad wykreśleniem dwóch składników każdego produktu, aby zobaczyć, że rozkład połączeń jest bardzo różny.

wykres u1 vs u2 i u1 vs u1

Należy pamiętać, że produkt jest zwykle duży (blisko 1), gdy oba składniki są duże, co dzieje się znacznie łatwiej, gdy oba składniki są idealnie skorelowane, a nie niezależne.

1ϵϵϵ/2U2U1×U2ϵ2/2

Całkiem różnica!

Pomoże to narysować kontury izoproduktów na wykresach takich jak powyższe - to znaczy na krzywych, gdzie xy = stała dla wartości takich jak 0,5, 0,6, 0,7, 0,8, 0,9. W miarę przechodzenia do coraz większych wartości proporcja punktów powyżej i po prawej stronie konturu spada znacznie szybciej w przypadku niezależnego przypadku.

Glen_b - Przywróć Monikę
źródło