Powiedzmy, że zależy od α . Rygorystycznie rzecz biorąc,
jeśli i α są zmiennymi losowymi, moglibyśmy napisać p ( X ∣ α ) ;
jeśli jednak jest zmienną losową, a α jest parametrem, musimy zapisać p ( X ; α ) .
Zauważyłem kilkakrotnie, że społeczność ucząca się maszyn wydaje się ignorować różnice i nadużywać warunków.
Na przykład w słynnym modelu LDA, gdzie jest parametrem Dirichleta zamiast zmiennej losowej.
Czy nie powinno to być ? Widzę wielu ludzi, w tym oryginalnych autorów artykułu LDA, piszących to jako p ( θ ∣ α ) .
machine-learning
terminology
Hazard Sibbs
źródło
źródło
Odpowiedzi:
Myślę, że chodzi tu bardziej o statystyki bayesowskie / nie bayesowskie niż o uczenie maszynowe vs. statystyki.
źródło