Wdrażam algorytm Naive Bayesa do kategoryzacji tekstu z wygładzaniem Laplaciana. Problem, który mam, polega na tym, że prawdopodobieństwo zbliża się do zera, ponieważ mnożę wiele małych ułamków. Dlatego prawdopodobieństwo ostatecznie daje zero. Jest tak, ponieważ w dokumentach i zestawach szkoleniowych znajduje się kilka słów.
Z tego powodu nie jestem w stanie kategoryzować tekstów. Czy istnieje sposób na obejście tego problemu? Czy robię coś złego w mojej realizacji?
Odpowiedzi:
źródło