Intuicyjne wyjaśnienie gęstości transformowanej zmiennej?

37

Załóżmy, że jest zmienną losową z pdf . Zatem zmienna losowa ma pdfXfX(x)Y=X2

fY(y)={12y(fX(y)+fX(y))y00y<0

Rozumiem rachunek za tym. Ale próbuję wymyślić sposób, aby wyjaśnić to komuś, kto nie zna rachunku różniczkowego. W szczególności próbuję wyjaśnić, dlaczego czynnik pojawia się z przodu. Zrobię to nożem:1y

Załóżmy, że ma rozkład Gaussa. Prawie cały ciężar jego PDF jest między wartościami, powiedzmy, i Ale to mapy do 0 do 9, . Tak, to waga ciężka w pdf do został rozszerzony w szerszym zakresie wartości w transformacji do . Tak więc, aby był prawdziwym pdf, dodatkowa waga musi zostać zmniejszona przez mnożnikX33.YXYfY(y)1y

Jak to brzmi?

Jeśli ktoś może podać własne wyjaśnienie lub link do jednego z nich w dokumencie lub podręczniku, bardzo to doceniam. Ten przykład transformacji zmiennej znajduję w kilku wstępach do matematycznych prawdopodobieństw / statystyk. Ale nigdy nie znajduję w tym intuicyjnego wyjaśnienia :(

lowndrul
źródło
Myślę, że twoje wyjaśnienie jest poprawne.
highBandWidth
2
Wyjaśnienie jest słuszne, ale ma charakter wyłącznie jakościowy: dokładna forma mnożnika jest nadal tajemnicą. Moc -1/2 po prostu pojawia się magicznie. Dlatego na pewnym poziomie musisz zrobić to samo, co robi Rachunek: znaleźć szybkość zmiany funkcji pierwiastka kwadratowego.
whuber

Odpowiedzi:

37

Pliki PDF mają wysokość, ale służą do przedstawienia prawdopodobieństwa za pomocą obszaru. Dlatego pomaga wyrazić plik PDF w sposób przypominający nam, że obszar jest równy wysokości razy podstawa.

Początkowo wysokość przy dowolnej wartości jest podana w pliku PDF . Podstawą jest nieskończenie segment , skąd rozkład (tj. Miara prawdopodobieństwa w przeciwieństwie do funkcji rozkładu ) jest tak naprawdę formą różniczkową lub „elementem prawdopodobieństwa”xfX(x)dx

PEX(x)=fX(x)dx.

Jest to obiekt, a nie PDF, z którym chcesz pracować zarówno koncepcyjnie, jak i praktycznie, ponieważ zawiera wszystkie elementy potrzebne do wyrażenia prawdopodobieństwa.

Kiedy ponownie wyrażamy w kategoriach , segmenty podstawowe zostają rozciągnięte (lub ściśnięte): przez podniesienie kwadratów obu końców przedziału od do widzimy, że podstawa obszaru musi być przedział długościxy=x2dxxx+dxy

dy=(x+dx)2x2=2xdx+(dx)2.

Ponieważ iloczyn dwóch nieskończoności jest znikomy w porównaniu do samych nieskończoności, dochodzimy do wniosku

dy=2xdx, whence dx=dy2x=dy2y.

Po ustaleniu tego obliczenia są banalne, ponieważ po prostu podłączamy nową wysokość i nową szerokość:

PEX(x)=fX(x)dx=fX(y)dy2y=PEY(y).

Ponieważ podstawą, pod względem , jest , cokolwiek się zwielokrotnia, musi to być wysokość, którą możemy odczytać bezpośrednio ze środkowego terminu jakoydy

12yfX(y)=fY(y).

To równanie nazwa nazwa skutecznie prawo powierzchni (= prawdopodobieństwo).PEX(x)=PEY(y)

Dwa pliki PDF

Ta grafika dokładnie pokazuje wąskie (prawie nieskończenie małe) fragmenty dwóch plików PDF powiązanych przez . Prawdopodobieństwa są reprezentowane przez zacienione obszary. Ze względu na ściśnięcie przedziału przez kwadraty, wysokość czerwonego obszaru ( , po lewej) musi zostać proporcjonalnie powiększona, aby pasowała do obszaru niebieskiego obszaru ( , po prawej).y=x2[0.32,0.45]yx

Whuber
źródło
2
Kocham nieskończenie małe. To wspaniałe wyjaśnienie. Myślenie w kategoriach , które wyraźnie widać jako pochodną transformacji, jest znacznie bardziej intuicyjne niż myślenie w kategoriach . Myślę, że tam był mój punkt zaczepienia. 2xy
lowndrul
@ whuber, uważam, że pierwszą linią powinien być ? Czy to masz na myśli przez ? PS: ciekawi mnie również twoich przemyśleń na temat mojej odpowiedzi (poniżej). P(X(x,x+dx))=fx(x)dxpdfX(x)
Carlos Cinelli
@Carlos To trochę bardziej rygorystyczne, aby wyrazić ten pomysł w sposób, w jaki ja to zrobiłem na początku: PDF jest tym, przez co mnożymy miarę Lebesgue'a , aby otrzymać podaną miarę prawdopodobieństwa. dx
whuber
@ Whuber, ale jeśli pdf jest tym, co zwielokrotniasz, to jest to , a nie produkt jak napisałeś, prawda? Nie jest jasne, dlaczego nazywacie produkt pdf. fX(x)fx(x)dxfX(x)dx
Carlos Cinelli
1
@Carlos: dziękuję; teraz rozumiem twój punkt widzenia. Wprowadziłem kilka zmian, aby rozwiązać ten problem.
whuber
11

Co powiesz na to, że jeśli produkuję obiekty, które są zawsze kwadratowe i znam rozkład długości boków kwadratów; co mogę powiedzieć o rozkładzie obszarów kwadratów?

W szczególności, jeśli znam rozkład losowej zmiennej , co mogę powiedzieć o ? Jedną rzeczą, którą możesz powiedzieć, jestXY=X2

FY(c)=P(Yc)=P(X2c)=P(cXc)=FX(c)FX(c).

Tak więc istnieje związek między CDF z i CDF z ; jaki jest związek między ich plikami PDF? Potrzebujemy do tego rachunku. Biorąc pochodne obu stron daje pożądane wyniki.YX

schenectady
źródło
2
(+1) Chociaż nie jest to pełna odpowiedź, jest to dobry sposób na znalezienie i jasno pokazuje, dlaczego jest to suma dwóch elementów, po jednym na pierwiastek kwadratowy. fY
whuber
1
Nie rozumiem, dlaczego pdf (x) = f (x) dx. Co z pdf (x) dx = f (x), density = prob mass/interval... co się mylę?
Fernando
2

Wyobraź sobie, że mamy populację, a jest podsumowaniem tej populacji. Następnie liczy odsetek osób, które mają zmienną w zakresie . Możesz to uznać za „kosz” o rozmiarze a my liczymy, ile osób jest w tym koszu.YP(Y(y,y+Δy))Y(y,y+Δy)Δy

Teraz nam ponownie wyrazić te osoby pod względem innej zmiennej, . Biorąc pod uwagę, że wiemy, że i są powiązane jako , zdarzenie jest takie samo jak zdarzenie który jest taki sam jak zdarzenie . Zatem osoby, które są w koszu muszą również znajdować się w przedziałach i . Innymi słowy, te kosze muszą mieć taki sam odsetek osób,XYXY=X2Y(y,y+Δy)X2(x2,(x+Δx)2)X(|x|,|x|+Δx) or X(|x|Δx,|x|)(y,y+Δy)(|x|,|x|+Δx)(|x|Δx,|x|)

P(Y(y,y+Δy))=P(X(|x|,|x|+Δx))+P(X(|x|Δx,|x|))

Ok, przejdźmy teraz do gęstości. Najpierw musimy zdefiniować, jaka jest gęstość prawdopodobieństwa . Jak sama nazwa wskazuje, jest to odsetek osobników na obszar . Oznacza to, że liczymy udział osób w tym pojemniku i dzielimy przez jego rozmiar . Ponieważ ustaliliśmy, że proporcje ludzi są tutaj takie same, ale rozmiar pojemników zmienił się, dochodzimy do wniosku, że gęstość będzie inna. Ale różni się o ile?

Jak powiedzieliśmy, gęstość prawdopodobieństwa jest proporcją ludzi w koszu podzieloną przez rozmiar bin, dlatego gęstość jest dana przez . Analogicznie gęstość prawdopodobieństwa jest dana przez .YfY(y):=P(Y(y,y+Δy))ΔyXfX(x):=P(X(x,x+Δx))Δx

Z naszego poprzedniego wyniku, że populacja w każdym pojemniku jest taka sama, mamy to,

fY(y):=P(Y(y,y+Δy))Δy=P(X(|x|,|x|+Δx))+P(X(|x|Δx,|x|))Δy=fX(|x|)Δx+fX(|x|)ΔxΔy=ΔxΔy(fX(|x|)+fX(|x|))=ΔxΔy(fX(y)+fX(y))

Oznacza to, że gęstość zmienia się o współczynnik , który jest względnym rozmiarem rozciągania lub ściskając rozmiar pojemnika. W naszym przypadku, ponieważ mamy to, że . Jeśli jest wystarczająco mała, możemy zignorować , co oznacza, że i , i dlatego w transformacji pojawia się współczynnik .fX(y)+fX(y)ΔxΔyy=x2y+Δy=(x+Δx)2=x2+2xΔx+Δx2ΔxΔx2Δy=2xΔxΔxΔy=12x=12y12y

Carlos Cinelli
źródło