Jak interpretować wysokość wykresów gęstości:
Na przykład na powyższym wykresie pik wynosi około 0,07 przy x = 18. Czy mogę wywnioskować, że około 7% wartości to około 18? Czy mogę być bardziej szczegółowy? Istnieje również drugi pik przy x = 30 o wysokości 0,02. Czy to znaczy, że około 2% wartości wynosi około 30?
Edycja: Pytanie o Czy wartość rozkładu prawdopodobieństwa przekraczająca 1 może być OK?omawia wartość prawdopodobieństwa> 1, co wcale nie jest tutaj problemem. Dyskutuje także, że w odniesieniu do naiwnej klasy Bayesa, co również nie ma tutaj znaczenia. Chcę mieć, w prostym języku, wnioski liczbowe, które możemy wyciągnąć z takich krzywych gęstości. Rola obszaru pod krzywą jest omawiana, ale moje pytanie dotyczy konkretnie, jakie wnioski możemy wyciągnąć w odniesieniu do konkretnej kombinacji xiy, która istnieje na krzywej. Na przykład, w jaki sposób możemy powiązać x = 30 iy = 0,02 na tym wykresie. Jakie stwierdzenie możemy tu napisać odnośnie relacji między 30 a 0,02 tutaj. Skoro gęstości dotyczą jednej wartości jednostkowej, czy możemy powiedzieć, że 2% wartości występuje między 29,5 a 30,5? W takim przypadku, jak interpretujemy, jeśli wartości różnią się od 0 do 1, jak na poniższym wykresie:
Jeśli 100% wartości występuje między 0 a 1, to dlaczego jakaś krzywa występuje poza 0 i 1?
Jest tu płaska część przy x = 0,1 do x = 0,2, gdzie y jest równe 0,8. Tworzy prostokąt. Jak możemy dowiedzieć się, jaki odsetek wartości występuje między x = 0,1 a x = 0,2
(PS: Jeśli uznasz to pytanie za interesujące / ważne, oceń je;)
źródło
Odpowiedzi:
Tutaj musisz zachować ostrożność. Zakładając, że x jest zmienną ciągłą, prawdopodobieństwo każdej pojedynczej wartości wynosi dokładnie zero. Mówienie, podobnie jak ty, o prawdopodobieństwie wartości leżącej w pewnym momencie jest w porządku, chociaż możesz chcieć być nieco bardziej precyzyjny. Drugie stwierdzenie, w którym podałeś przedział wraz z prawdopodobieństwem, byłoby tym, czego szukałem.
Zasadniczo, całka funkcji gęstości w odniesieniu do x powie ci o samym prawdopodobieństwie (dlatego nazywa się gęstością ). Oczywiście przedział czasu, w którym będziesz się integrować, może być dowolnie mały, więc możesz zbliżyć się do punktu do dowolnego stopnia. To powiedziawszy, gdy funkcja gęstości zmienia się bardzo powoli w tym przedziale, można przybliżać całkę za pomocą jakiejś techniki numerycznej, takiej jak reguła trapezoidalna .
Podsumowując: wysokość funkcji gęstości jest właśnie taka, jej wysokość. Wszystko, co możesz chcieć wyciągnąć na temat prawdopodobieństwa, będzie musiało obejmować integrację takiej czy innej formy.
źródło