Obecnie biorę kurs PGM prowadzony przez Daphne Koller na Coursera. W tym celu generalnie modelujemy Sieć Bayesowską jako ukierunkowany na przyczynę i efekt wykres zmiennych, które są częścią obserwowanych danych. Ale na samouczkach i przykładach PyMC ogólnie widzę, że nie jest to modelowane tak samo jak PGM, a przynajmniej jestem zdezorientowany. W PyMC rodzice każdej obserwowanej zmiennej świata rzeczywistego są często parametrami rozkładu używanymi do modelowania zmiennej.
Teraz moje pytanie jest naprawdę praktyczne. Załóżmy, że mam 3 zmienne, dla których dane są obserwowane (A, B, C) (załóżmy, że są to zmienne ciągłe tylko ze względu na to). Z pewnej wiedzy w dziedzinie można powiedzieć, że A i B powodują C. Więc mamy tutaj BN - A, B to rodzice, a C to dzieci. teraz z równania BN P (A, B, C) = P (C | A, B) * P (A) * P (B)
Mogę powiedzieć, że A i B to jakieś normalne rozkłady z pewnym mu i sigma, ale jak modelować P (C | A, B)? Ogólny pomysł, którego chcę się nauczyć, polega na tym, jak nauczyć się tego BN za pomocą PyMC, aby móc wysłać zapytanie do BN. A może muszę w jakiś sposób uzupełnić BN o parametry modelu.
Czy ten problem można rozwiązać za pomocą pymc? czy też popełniłem błędy w podstawach?
Każda pomoc będzie mile widziana!
źródło