Statystyki i duże zbiory danych

14
Przykład działania sztuczki log-sum-exp w Naive Bayes

Czytałem o sztuczce log-sum-exp w wielu miejscach (np. Tutaj i tutaj ), ale nigdy nie widziałem przykładu, w jaki sposób jest ona stosowana konkretnie do klasyfikatora Naive Bayes (np. Z funkcjami dyskretnymi i dwiema klasami) Jak dokładnie można uniknąć problemu niedopełnienia liczb przy użyciu...

14
k-średnie vs k-mediana?

Wiem, że istnieje algorytm grupowania k-średnich i k-mediana. Jeden, który wykorzystuje średnią jako środek skupienia, a drugi wykorzystuje medianę. Moje pytanie brzmi: kiedy / gdzie użyć

14
Pasma ufności dla linii QQ

To pytanie nie dotyczy konkretnie R, ale postanowiłem Rto zilustrować. Rozważ kod do tworzenia pasm ufności wokół (normalnej) linii qq: library(car) library(MASS) b0<-lm(deaths~.,data=road) qqPlot(b0$resid,pch=16,line="robust") Szukam wyjaśnienia (lub alternatywnego linku do dokumentu...

14
Stosowność analizy ANOVA po analizie skupień k-średnich

Powiadomienie po tabeli ANOVA po analizie K-średnich wskazuje, że poziomy istotności nie powinny być traktowane jako test równych średnich, ponieważ rozwiązanie klastrowe zostało wyprowadzone na podstawie odległości euklidesowej w celu maksymalizacji odległości. Jakiego testu należy użyć, aby...