Załóżmy, że jest zmienną losową z pdf . Zatem zmienna losowa ma pdf
Rozumiem rachunek za tym. Ale próbuję wymyślić sposób, aby wyjaśnić to komuś, kto nie zna rachunku różniczkowego. W szczególności próbuję wyjaśnić, dlaczego czynnik pojawia się z przodu. Zrobię to nożem:
Załóżmy, że ma rozkład Gaussa. Prawie cały ciężar jego PDF jest między wartościami, powiedzmy, i Ale to mapy do 0 do 9, . Tak, to waga ciężka w pdf do został rozszerzony w szerszym zakresie wartości w transformacji do . Tak więc, aby był prawdziwym pdf, dodatkowa waga musi zostać zmniejszona przez mnożnik
Jak to brzmi?
Jeśli ktoś może podać własne wyjaśnienie lub link do jednego z nich w dokumencie lub podręczniku, bardzo to doceniam. Ten przykład transformacji zmiennej znajduję w kilku wstępach do matematycznych prawdopodobieństw / statystyk. Ale nigdy nie znajduję w tym intuicyjnego wyjaśnienia :(
źródło
Odpowiedzi:
Pliki PDF mają wysokość, ale służą do przedstawienia prawdopodobieństwa za pomocą obszaru. Dlatego pomaga wyrazić plik PDF w sposób przypominający nam, że obszar jest równy wysokości razy podstawa.
Początkowo wysokość przy dowolnej wartości jest podana w pliku PDF . Podstawą jest nieskończenie segment , skąd rozkład (tj. Miara prawdopodobieństwa w przeciwieństwie do funkcji rozkładu ) jest tak naprawdę formą różniczkową lub „elementem prawdopodobieństwa”x fX(x) dx
Jest to obiekt, a nie PDF, z którym chcesz pracować zarówno koncepcyjnie, jak i praktycznie, ponieważ zawiera wszystkie elementy potrzebne do wyrażenia prawdopodobieństwa.
Kiedy ponownie wyrażamy w kategoriach , segmenty podstawowe zostają rozciągnięte (lub ściśnięte): przez podniesienie kwadratów obu końców przedziału od do widzimy, że podstawa obszaru musi być przedział długościx y=x2 dx x x+dx y
Ponieważ iloczyn dwóch nieskończoności jest znikomy w porównaniu do samych nieskończoności, dochodzimy do wniosku
Po ustaleniu tego obliczenia są banalne, ponieważ po prostu podłączamy nową wysokość i nową szerokość:
Ponieważ podstawą, pod względem , jest , cokolwiek się zwielokrotnia, musi to być wysokość, którą możemy odczytać bezpośrednio ze środkowego terminu jakoy dy
To równanie nazwa nazwa skutecznie prawo powierzchni (= prawdopodobieństwo).PEX(x)=PEY(y)
Ta grafika dokładnie pokazuje wąskie (prawie nieskończenie małe) fragmenty dwóch plików PDF powiązanych przez . Prawdopodobieństwa są reprezentowane przez zacienione obszary. Ze względu na ściśnięcie przedziału przez kwadraty, wysokość czerwonego obszaru ( , po lewej) musi zostać proporcjonalnie powiększona, aby pasowała do obszaru niebieskiego obszaru ( , po prawej).y=x2 [0.32,0.45] y x
źródło
Co powiesz na to, że jeśli produkuję obiekty, które są zawsze kwadratowe i znam rozkład długości boków kwadratów; co mogę powiedzieć o rozkładzie obszarów kwadratów?
W szczególności, jeśli znam rozkład losowej zmiennej , co mogę powiedzieć o ? Jedną rzeczą, którą możesz powiedzieć, jestX Y=X2
Tak więc istnieje związek między CDF z i CDF z ; jaki jest związek między ich plikami PDF? Potrzebujemy do tego rachunku. Biorąc pochodne obu stron daje pożądane wyniki.Y X
źródło
density = prob mass/interval
... co się mylę?Wyobraź sobie, że mamy populację, a jest podsumowaniem tej populacji. Następnie liczy odsetek osób, które mają zmienną w zakresie . Możesz to uznać za „kosz” o rozmiarze a my liczymy, ile osób jest w tym koszu.Y P(Y∈(y,y+Δy)) Y (y,y+Δy) Δy
Teraz nam ponownie wyrazić te osoby pod względem innej zmiennej, . Biorąc pod uwagę, że wiemy, że i są powiązane jako , zdarzenie jest takie samo jak zdarzenie który jest taki sam jak zdarzenie . Zatem osoby, które są w koszu muszą również znajdować się w przedziałach i . Innymi słowy, te kosze muszą mieć taki sam odsetek osób,X Y X Y=X2 Y∈(y,y+Δy) X2∈(x2,(x+Δx)2) X∈(|x|,|x|+Δx) or X∈(−|x|−Δx,−|x|) (y,y+Δy) (|x|,|x|+Δx) (−|x|−Δx,−|x|)
Ok, przejdźmy teraz do gęstości. Najpierw musimy zdefiniować, jaka jest gęstość prawdopodobieństwa . Jak sama nazwa wskazuje, jest to odsetek osobników na obszar . Oznacza to, że liczymy udział osób w tym pojemniku i dzielimy przez jego rozmiar . Ponieważ ustaliliśmy, że proporcje ludzi są tutaj takie same, ale rozmiar pojemników zmienił się, dochodzimy do wniosku, że gęstość będzie inna. Ale różni się o ile?
Jak powiedzieliśmy, gęstość prawdopodobieństwa jest proporcją ludzi w koszu podzieloną przez rozmiar bin, dlatego gęstość jest dana przez . Analogicznie gęstość prawdopodobieństwa jest dana przez .Y fY(y):=P(Y∈(y,y+Δy))Δy X fX(x):=P(X∈(x,x+Δx))Δx
Z naszego poprzedniego wyniku, że populacja w każdym pojemniku jest taka sama, mamy to,
Oznacza to, że gęstość zmienia się o współczynnik , który jest względnym rozmiarem rozciągania lub ściskając rozmiar pojemnika. W naszym przypadku, ponieważ mamy to, że . Jeśli jest wystarczająco mała, możemy zignorować , co oznacza, że i , i dlatego w transformacji pojawia się współczynnik .fX(y√)+fX(−y√) ΔxΔy y=x2 y+Δy=(x+Δx)2=x2+2xΔx+Δx2 Δx Δx2 Δy=2xΔx ΔxΔy=12x=12y√ 12y√
źródło