Jak interpretować wysokość wykresu gęstości

12

Jak interpretować wysokość wykresów gęstości:

wprowadź opis zdjęcia tutaj

Na przykład na powyższym wykresie pik wynosi około 0,07 przy x = 18. Czy mogę wywnioskować, że około 7% wartości to około 18? Czy mogę być bardziej szczegółowy? Istnieje również drugi pik przy x = 30 o wysokości 0,02. Czy to znaczy, że około 2% wartości wynosi około 30?

Edycja: Pytanie o Czy wartość rozkładu prawdopodobieństwa przekraczająca 1 może być OK?omawia wartość prawdopodobieństwa> 1, co wcale nie jest tutaj problemem. Dyskutuje także, że w odniesieniu do naiwnej klasy Bayesa, co również nie ma tutaj znaczenia. Chcę mieć, w prostym języku, wnioski liczbowe, które możemy wyciągnąć z takich krzywych gęstości. Rola obszaru pod krzywą jest omawiana, ale moje pytanie dotyczy konkretnie, jakie wnioski możemy wyciągnąć w odniesieniu do konkretnej kombinacji xiy, która istnieje na krzywej. Na przykład, w jaki sposób możemy powiązać x = 30 iy = 0,02 na tym wykresie. Jakie stwierdzenie możemy tu napisać odnośnie relacji między 30 a 0,02 tutaj. Skoro gęstości dotyczą jednej wartości jednostkowej, czy możemy powiedzieć, że 2% wartości występuje między 29,5 a 30,5? W takim przypadku, jak interpretujemy, jeśli wartości różnią się od 0 do 1, jak na poniższym wykresie:

wprowadź opis zdjęcia tutaj

Jeśli 100% wartości występuje między 0 a 1, to dlaczego jakaś krzywa występuje poza 0 i 1?

Jest tu płaska część przy x = 0,1 do x = 0,2, gdzie y jest równe 0,8. Tworzy prostokąt. Jak możemy dowiedzieć się, jaki odsetek wartości występuje między x = 0,1 a x = 0,2

(PS: Jeśli uznasz to pytanie za interesujące / ważne, oceń je;)

rnso
źródło
4
Pierwszy wątek wymieniony jako duplikat jest istotny, pomimo dokładnego sformułowania w jego tytule, ponieważ stanowi kluczową kwestię, że obliczona dla zmiennych ciągłych gęstość prawdopodobieństwa nie jest prawdopodobieństwem. (Bardziej subtelna wersja określa rygorystycznie gęstość i obejmuje możliwość, że gęstość jest definiowana przez zliczanie miary).
Nick Cox
Zgadzam się z @NickCox, chociaż przy dodatkowych edycjach większy nacisk położono na obszar (który jest jak trzecie pytanie), a także wysokość (która jest bardziej jak drugie pytanie) na bardzo dobrej liście pytań Tima.
Silverfish,
3
Istnieje również osobna kwestia, która nie została poruszona w tych pytaniach, i dlatego nie sądzę, że jest to ogólnie duplikat któregokolwiek z tych pytań indywidualnie: dlaczego w empirycznych, w przeciwieństwie do teoretycznych wykresów gęstości, może istnieć „gęstość” na zewnątrz wsparcie (lub obserwowane wartości) rozkładu? Wymaga to dodatkowej dyskusji na temat przepustowości oraz budowy i interpretacji wykresów gęstości jądra. Być może to pytanie skorzystałoby z edycji i ponownego skoncentrowania się na tych kwestiach, które nie powielają istniejących pytań.
Silverfish,

Odpowiedzi:

6

Tutaj musisz zachować ostrożność. Zakładając, że x jest zmienną ciągłą, prawdopodobieństwo każdej pojedynczej wartości wynosi dokładnie zero. Mówienie, podobnie jak ty, o prawdopodobieństwie wartości leżącej w pewnym momencie jest w porządku, chociaż możesz chcieć być nieco bardziej precyzyjny. Drugie stwierdzenie, w którym podałeś przedział wraz z prawdopodobieństwem, byłoby tym, czego szukałem.

Zasadniczo, całka funkcji gęstości w odniesieniu do x powie ci o samym prawdopodobieństwie (dlatego nazywa się gęstością ). Oczywiście przedział czasu, w którym będziesz się integrować, może być dowolnie mały, więc możesz zbliżyć się do punktu do dowolnego stopnia. To powiedziawszy, gdy funkcja gęstości zmienia się bardzo powoli w tym przedziale, można przybliżać całkę za pomocą jakiejś techniki numerycznej, takiej jak reguła trapezoidalna .

Podsumowując: wysokość funkcji gęstości jest właśnie taka, jej wysokość. Wszystko, co możesz chcieć wyciągnąć na temat prawdopodobieństwa, będzie musiało obejmować integrację takiej czy innej formy.

Fato39
źródło
czy powierzchnia pod krzywą zawsze sumuje się do 1,0 na tego rodzaju wykresie?
ecologist1234
1
-