Kiedy stosować sieci Bayesian w porównaniu z innymi metodami uczenia maszynowego?

13

Spodziewam się, że nie ma ostatecznej odpowiedzi na to pytanie. Ale w przeszłości korzystałem z wielu algorytmów uczenia maszynowego i staram się dowiedzieć o sieciach bayesowskich. Chciałbym zrozumieć, w jakich okolicznościach lub dla jakiego rodzaju problemów wybrałbyś wykorzystanie Bayesian Network w porównaniu z innymi podejściami?

machine-learning bayesian-network AndyC
źródło

3

Dla mnie Sieci Bayesowskie są sposobem na zdefiniowanie warunkowej niezależności w modelu. Po zdefiniowaniu tego, myślę, że możesz użyć różnych narzędzi edukacyjnych do oszacowania parametrów modelu. Widzę więc wyraźny rozdział między uczeniem się parametrów a modelem. Nie jestem jednak ekspertem w tej dziedzinie, więc ktoś może uzyskać lepszą odpowiedź.

Luca

8

$X$ $Y$ $P(X,Y)$ $P(Y|X)$

$P(X_1|Y)$ $P(X_1|X_2=A, X_3=B)$ $P(Y|X)$

BN wykorzystują DAG do określania wspólnej dystrybucji. Stąd są to modele graficzne.

Zalety:

Kiedy brakuje wielu danych, np. W medycynie, BN mogą być bardzo skuteczne, ponieważ modelowanie wspólnego rozkładu (tj. Twoje twierdzenie o tym, jak dane zostały wygenerowane) zmniejsza twoją zależność od posiadania w pełni obserwowanego zestawu danych.
$\text{cause} \to \text{effect}$
Uczenie się rozkładu połączeń jest trudnym zadaniem, modelowanie go dla zmiennych dyskretnych (poprzez obliczenie tabel prawdopodobieństwa warunkowego, tj. CPT) jest znacznie łatwiejsze niż próba zrobienia tego samego dla zmiennych ciągłych. Zatem BN są praktycznie bardziej powszechne w przypadku zmiennych dyskretnych.
BN umożliwiają nie tylko wnioskowanie obserwacyjne (jak pozwalają na to wszystkie modele uczenia maszynowego), ale także interwencje przyczynowe . Jest to często zaniedbywana i niedoceniana zaleta BN i jest związana z alternatywnym rozumowaniem.

Zhubarb
źródło

1

W przewadze 1, w której twierdzisz, że BN są skuteczne w modelowaniu danych z dużą ilością brakujących wartości, czy te brakujące wartości nie wpływają na prawidłową identyfikację niezależności w danych?

Hossein

1

P (Y, X_{1}, X_{2})

$P(Y,X_1,X_2)$

X_{1}

$X_1$

X_{2}

$X_2$

1

Z mojego doświadczenia wynika, że Bayesian Networks działa bardzo dobrze, gdy występują wysokiej jakości dane kategoryczne . Dają modele interpretowalne, które (czasem) pomagają zrozumieć, w jaki sposób różne zmienne oddziałują na siebie.

Dębnik
źródło

Kiedy stosować sieci Bayesian w porównaniu z innymi metodami uczenia maszynowego?

Odpowiedzi: