Interpretacja wykresów gęstości warunkowej

10

Chciałbym wiedzieć, jak poprawnie interpretować wykresy gęstości warunkowej. Włożenia dwa poniżej utworzonego w R z cdplot.

Na przykład, czy prawdopodobieństwo, że Wynik będzie równy 1, gdy Var 1 wynosi 150, wynosi około 80%?

wykres gęstości warunkowej

Ciemnoszary obszar to takie, które jest warunkowym prawdopodobieństwem Resultbycia równym 1, prawda?

wykres gęstości warunkowej

Z cdplotdokumentacji:

cdplot oblicza gęstości warunkowe x, biorąc pod uwagę poziomy y ważone rozkładem krańcowym y. Gęstości oblicza się łącznie na poziomach y.

Jak ta kumulacja wpływa na interpretację tych wykresów?

nieoficjalnie
źródło

Odpowiedzi:

7

Na przykład, czy prawdopodobieństwo, że Wynik będzie równy 1, gdy Var 1 wynosi 150, wynosi około 80%?

Nie, jest na odwrót. Prawdopodobieństwo, że Wynik gdy War1 wynosi około 80%. Podobnie prawdopodobieństwo, że Wynik gdy Var1 wynosi około 20%.= 150 = 1 = 150=0=150=1=150

Ciemnoszary obszar to taki, który jest warunkowym prawdopodobieństwem, że Wynik będzie równy 1, prawda?

Ciemny zacieniony obszar odpowiada wynikowi ; obszar zacieniowany odpowiada wynikowi .= 1=0=1

Jeśli masz więcej niż dwa poziomy współczynnika wyniku, prawdopodobnie bardziej oczywiste będzie to, co jest przedstawiane. Jesteśmy przyzwyczajeni do patrzenia na funkcje gęstości, więc ta prezentacja może być na początku myląca.

Jak ta kumulacja wpływa na interpretację tych wykresów?

Patrząc na źródło cdplot(), wydaje mi się, że wygładzone proporcje wyników ważone są gęstością zmiennej objaśniającej. Zatem rozkłady zmiennej zależnej będą lepiej reprezentowane w regionach o większej gęstości zmiennej objaśniającej.

Jednym ze sposobów interpretacji jest to, że tam, gdzie istnieją regiony zmiennej objaśniającej z kilkoma punktami, rozkłady warunkowe nie będą tak dobrze określone. Tam, gdzie są regiony zmiennej objaśniającej z większą liczbą punktów, rozkłady warunkowe będą lepiej określone.

jvbraun
źródło