Czytałem tutaj , że biorąc próbkę z ciągłego rozkładu z ED M X próbkę odpowiadającą U I = C X ( X I ) następujące standardowe rozkładu równomiernego.
Zweryfikowałem to za pomocą symulacji jakościowych w Pythonie i łatwo mogłem zweryfikować związek.
import matplotlib.pyplot as plt
import scipy.stats
xs = scipy.stats.norm.rvs(5, 2, 10000)
fig, axes = plt.subplots(1, 2, figsize=(9, 3))
axes[0].hist(xs, bins=50)
axes[0].set_title("Samples")
axes[1].hist(
scipy.stats.norm.cdf(xs, 5, 2),
bins=50
)
axes[1].set_title("CDF(samples)")
Wynikające z następującego wątku:
Nie jestem w stanie zrozumieć, dlaczego tak się dzieje. Zakładam, że ma to związek z definicją CDF i jej związku z plikiem PDF, ale czegoś mi brakuje ...
Byłbym wdzięczny, gdyby ktoś mógł skierować mnie na lekturę na ten temat lub pomóc mi w uzyskaniu intuicji na ten temat.
EDYCJA: CDF wygląda następująco:
Odpowiedzi:
Załóżmy, że jest ciągły i rośnie. Zdefiniuj Z = F X ( X ) i zwróć uwagę, że Z przyjmuje wartości w [ 0 , 1 ] . Następnie F Z ( x ) = P ( F X ( X ) ≤ x ) = P ( X ≤ F - 1 X ( x ) ) = F X ( F -FX Z=FX(X) Z [0,1]
Z drugiej strony, jeśli jest jednorodną zmienną losową, która przyjmuje wartości w [ 0 , 1 ] , F U ( x ) = ∫ R f U ( u )U [0,1]
Zatem dla każdego x ∈ [ 0 , 1 ] .FZ(x)=FU(x) x∈[0,1]
źródło
Intuicyjnie może warto o tym myślećfa( x ) jako funkcja percentyla, np fa( x ) losowo wygenerowanej próbki z DF fa ma spaść poniżej x . Na przemianfa- 1 (myśl odwrotne obrazy, a nie właściwa funkcja odwrotna per se ) jest funkcją „kwantylową”. To jest,x = F.- 1( p ) jest sedno x za którymi spada p proporcja próbki. Skład funkcjonalny jest mierzalnie przemiennyfa∘ F.- 1=λfa- 1∘ F. .
Rozkład równomierny jest jedynym rozkładem posiadającym funkcję kwantylową równą funkcji percentyla: są one funkcją tożsamości. Zatem przestrzeń obrazu jest taka sama jak przestrzeń prawdopodobieństwa.fa odwzorowuje ciągłe zmienne losowe na przestrzeń (0, 1) z jednakową miarą. Ponieważ dla dowolnych dwóch percentylia < b , mamy P.( F.- 1(a)<x<F−1(b))=P(a<F(X)<b)=b−a
źródło