Dla problemu bayesowskiej regresji logistycznej stworzyłem rozkład predykcyjny boczny. Próbuję z rozkładu predykcyjnego i otrzymuję tysiące próbek (0,1) dla każdej mojej obserwacji. Wizualizacja dobroci dopasowania jest mniej niż interesująca, na przykład:
Ten wykres pokazuje 10 000 próbek + zaobserwowany punkt odniesienia (sposób w lewo można dostrzec czerwoną linię: tak, to obserwacja). Problem polega na tym, że ten wykres nie ma charakteru informacyjnego i będę miał 23 z nich, po jednym dla każdego punktu danych.
Czy istnieje lepszy sposób na wizualizację 23 punktów danych oraz próbek z tyłu.
Kolejna próba:
Kolejna próba na podstawie artykułu tutaj
bayesian
data-visualization
classification
goodness-of-fit
binary-data
Cam.Davidson.Pilon
źródło
źródło
Odpowiedzi:
Mam wrażenie, że nie do końca oddajesz wszystkie towary swojej sytuacji, ale biorąc pod uwagę to, co mamy przed sobą, rozważmy użyteczność prostej kropki do wyświetlenia informacji.
Jedyną prawdziwą rzeczą, której nie ma tutaj (być może nie są to zachowania domyślne):
Sortowanie jest prawdziwym wyzwaniem dla takich wykresów punktowych. Sortowanie według wartości proporcji tutaj pomaga łatwo odkryć duże obserwacje resztkowe. Posiadanie systemu, w którym można łatwo sortować według wartości zawartych w wykresie lub w zewnętrznych cechach skrzynek, jest najlepszym sposobem na uzyskanie haju.
Ta rada obejmuje również ciągłe obserwacje. Możesz pokolorować / ukształtować punkty zgodnie z tym, czy reszta jest ujemna czy dodatnia, a następnie dopasować rozmiar punktu do absolutnej (lub kwadratowej) reszty. Nie jest to jednak IMO konieczne ze względu na prostotę obserwowanych wartości.
źródło
Typowym sposobem wizualizacji dopasowania modelu regresji logistycznej Bayesa za pomocą jednego predyktora jest wykreślenie rozkładu predykcyjnego wraz z odpowiednimi proporcjami. (Daj mi znać, jeśli rozumiem twoje pytanie)
Przykład z wykorzystaniem popularnego zestawu danych Bliss.
Kod poniżej w R:
źródło
ni = 23
ano = 7
i każda z 23 osób ma innądose
. Możesz zrobić podobny wykres dla danych PO (punkty są albo umieszczone na 0, albo na 1 na osi Y, a ty kreślisz funkcję). Zobacz przykłady podobnych wykresów regresji logistycznej w odnośnikach podanych w tej odpowiedzi .Odpowiadam na prośbę o alternatywne techniki graficzne, które pokazują, jak dobrze symulowane zdarzenia awarii odpowiadają obserwowanym zdarzeniom awarii. Powstało pytanie w „probabilistyczny Bayesa Metody Programowania i dla hakerów” znaleźć tutaj . Oto moje podejście graficzne:
Kod znaleźć tutaj .
źródło