Statystyki i duże zbiory danych

31
Średni błąd kwadratu i rezydualna suma kwadratów

Patrząc na definicje Wikipedii: Mean Squared Error (MSE) Resztkowa suma kwadratów (RSS) Tak mi się wydaje MSE = 1N.RSS = 1N.∑ ( fja- yja)2)MSE=1NRSS=1N∑(fi−yi)2\text{MSE} = \frac{1}{N} \text{RSS} = \frac{1}{N} \sum (f_i -y_i)^2 gdzie N.NN jest numerem on próbek i fifif_i jest nasza ocena...

31
Zamieniając wartości odstające na średnie

To pytanie zadał mój przyjaciel, który nie jest obeznany z Internetem. Nie mam statystyk i szukałem w Internecie tego pytania. Pytanie brzmi: czy możliwe jest zastąpienie wartości odstających wartością średnią? jeśli to możliwe, czy są jakieś odniesienia do książek / czasopisma, na których można...

31
Kiedy szacunek obciążenia początkowego jest prawidłowy?

Często twierdzi się, że ładowanie początkowe może zapewnić oszacowanie błędu systematycznego w estymatorze. Jeśli jest szacunkiem dla niektórych statystyk, a są replikami ładowania początkowego (z ), to szacunek obciążenia początkowego szacunku wynosi co wydaje się niezwykle proste i potężne,...

31
Jak Naive Bayes jest klasyfikatorem liniowym?

Widziałem tutaj inny wątek , ale nie sądzę, by odpowiedź zaspokoiła faktyczne pytanie. Ciągle czytam, że Naive Bayes jest klasyfikatorem liniowym (np. Tutaj ) (takim, że wyznacza liniową granicę decyzyjną) za pomocą demonstracji logarytmicznych szans. Symulowałem jednak dwie chmury Gaussa i...