Koncepcyjnie rozumiem znaczenie wyrażenia „całkowity obszar pod plikiem PDF wynosi 1”. Powinno to oznaczać, że prawdopodobieństwo, że wynik znajdzie się w całkowitym przedziale możliwości, wynosi 100%.
Ale tak naprawdę nie mogę tego zrozumieć z „geometrycznego” punktu widzenia. Jeśli na przykład w pliku PDF oś x reprezentuje długość, to czy całkowity obszar pod krzywą nie byłby większy, gdyby x był mierzony w mm zamiast w km?
Zawsze staram się wyobrazić sobie, jak wyglądałby obszar pod krzywą, gdyby funkcja była spłaszczona do linii prostej. Czy wysokość (pozycja na osi y) tej linii byłaby taka sama dla dowolnego pliku PDF, czy też miałaby wartość zależną od interwału na osi x, dla którego funkcja jest zdefiniowana?
probability
pdf
integral
TheChymera
źródło
źródło
Odpowiedzi:
Funkcja gęstości prawdopodobieństwa jest mierzona w procentach na jednostkę miary osi x. Powiedzmy, że w danym punkciex0 twój PDF jest równy 1000. Oznacza to, że prawdopodobieństwo x0< x < x0+ dx wynosi 1000rex gdzierex jest w metrach. Jeśli zmienisz jednostki na centymetry, prawdopodobieństwo nie powinno się zmienić dla tego samego przedziału, ale ten sam przedział ma o 100 centymetrów więcej niż metry, więc1000rex = PD F.′( x′0) ⋅ 100rex′ i rozwiązując otrzymujemyP.D F.′( x′0) = PD F.( x0)100 . Jest 100 razy mniej jednostek prawdopodobieństwa (procentów) na centymetr niż na metr.
źródło
Może to pomóc zrozumieć, że oś pionowa jest mierzona jako gęstość prawdopodobieństwa . Jeśli więc oś pozioma jest mierzona w km, wówczas oś pionowa jest mierzona jako gęstość prawdopodobieństwa „na km”. Załóżmy, że narysujemy prostokątny element na takiej siatce, która ma szerokość 5 „km” i wysokość 0,1 „na km” (którą wolisz napisać jako „km - 1 ”). Obszar tego prostokąta wynosi 5 km x 0,1 km - 1 = 0,5. Jednostki anulują się, a my pozostaniemy z prawdopodobieństwem połowy.−1 −1
Jeśli zmieniłeś jednostki poziome na „metry”, musisz zmienić jednostki pionowe na „na metr”. Prostokąt miałby teraz szerokość 5000 metrów i gęstość (wysokość) wynoszącą 0,0001 na metr. Nadal masz szansę na połowę. Możesz być zaniepokojony tym, jak dziwnie te dwa wykresy będą wyglądały na stronie w porównaniu do siebie (czy jeden nie musi być znacznie szerszy i krótszy od drugiego?), Ale kiedy rysujesz fizycznie wykresy, możesz użyć cokolwiek skaluj lubisz. Spójrz poniżej, aby zobaczyć, jak mało dziwności wymaga.
Pomocne może być rozważenie histogramów przed przejściem do krzywych gęstości prawdopodobieństwa. Pod wieloma względami są one analogiczne. Osią pionową histogramu jest gęstość częstotliwości [na jednostkę ],x a obszary reprezentują częstotliwości, ponownie, ponieważ jednostki poziome i pionowe anulują się po pomnożeniu. Krzywa PDF jest rodzajem ciągłej wersji histogramu o całkowitej częstotliwości równej jeden.
Jeszcze bliższą analogią jest histogram częstotliwości względnej - mówimy, że taki histogram został „znormalizowany”, więc elementy obszaru reprezentują teraz proporcje oryginalnego zestawu danych, a nie surowe częstotliwości, a całkowity obszar wszystkich słupków wynosi jeden. Wysokości są teraz względnymi gęstościami częstotliwości [na jednostkę ]x . Jeśli histogram częstotliwości względnej ma słupek biegnący wzdłuż x wartości od 20 km do 25 km (więc szerokość paska wynosi 5 km) i ma względną gęstość częstotliwości 0,1 na km, wtedy ten pasek zawiera 0,5 części danych. Odpowiada to dokładnie idei, że losowo wybrany element z twojego zestawu danych ma 50% prawdopodobieństwa leżenia w tym pasku. Nadal obowiązuje poprzedni argument dotyczący wpływu zmian jednostek: porównaj proporcje danych leżących w słupku od 20 km do 25 km z tymi w wykresie 20 000 metrów do 25 000 metrów dla tych dwóch wykresów. Możesz również potwierdzić arytmetycznie, że pola wszystkich słupków sumują się do jednego w obu przypadkach.
Co mogłem rozumieć przez moje twierdzenie, że PDF jest „rodzajem ciągłej wersji histogramu”? Weźmy mały pasek pod krzywą gęstości prawdopodobieństwa, wzdłuż wartości przedziale [ xx , więc pasek maszerokość δ x szerokości, a wysokość krzywej jest w przybliżeniu stała f ( x ) . Możemy narysować pręt o tej wysokości, którego powierzchnia f ( x )[x,x+δx] δx f(x) oznacza przybliżone prawdopodobieństwo leżenia w tym pasku.f(x)δx
Jak możemy znaleźć pole pod krzywą pomiędzy oraz x = b ? Możemy podzielić ten przedział na małe paski i wziąć sumę obszarów słupków, ∑ f ( xx=a x=b , co odpowiadałoby przybliżonemu prawdopodobieństwu leżenia w przedziale [ a , b ] . Widzimy, że krzywa i pręty nie są dokładnie wyrównane, więc w naszym przybliżeniu występuje błąd. Zmniejszając δ x coraz mniej dla każdego słupka, wypełniamy przedział większą liczbą i węższymi słupkami, których ∑ f ( x∑f(x)δx [a,b] δx ∑f(x)δx zapewnia lepsze oszacowanie obszaru.
Aby dokładnie obliczyć powierzchnię, zamiast zakładać, że była stała na każdym pasku, oceniamy całkę ∫ b af(x) , a to odpowiada rzeczywistemu prawdopodobieństwu leżenia w przedziale [ a , b ] . Całkowanie na całej krzywej daje jeden całkowity obszar (tj. Całkowite prawdopodobieństwo) jeden, z tego samego powodu, że sumowanie obszarów wszystkich słupków histogramu częstotliwości względnej daje całkowite pole (tj. Całkowity udział) jednego. Sama integracja jest rodzajem ciągłej wersji pobierania sumy.∫baf(x)dx [a,b]
Kod R dla wykresów
źródło
Masz już dwie odpowiedzi, z doskonałą przez Silverfish , jednak uważam, że ilustracja może być przydatna, ponieważ pytasz o geometrię i „wyobrażasz sobie” te funkcje.
Zacznijmy od prostego przykładu dystrybucji Bernoulli :
Ponieważ wartości są dyskretne, nie ma „krzywej”, ale tylko dwa punkty, jednak idea jest podobna: jeśli chcesz poznać całkowite prawdopodobieństwo (obszar pod krzywą), musisz zsumować prawdopodobieństwa obu możliwych wyników:
0.010 0.028 0.094 0.198 0.260 0.400 0.404 0.292 0.166 0.092 0.044 0.010 0.002
Pytałeś także o rozkład „płaski” (jednolity) :
źródło
Następujący kluczowy pomysł został wymieniony w komentarzu, ale nie w istniejącej odpowiedzi ...
Jednym ze sposobów intuicji na temat właściwości pliku PDF jest uznanie, że plik PDF i CDF są powiązane przez całkowanie (rachunek różniczkowy) - i że CDF ma monotoniczny wynik reprezentujący wartość prawdopodobieństwa między 0 a 1.
Jednostki osi X nie wpływają na bezjednostkowe zintegrowane całkowite pole pod krzywą PDF.
Mówiąc prosto:
Jeśli oś X powiększa się liczbowo z powodu zmiany jednostek, wówczas oś Y musi być mniejsza o odpowiedni współczynnik liniowy .
źródło