Statystyki i duże zbiory danych

14
Skalowanie cech i średnia normalizacja

Biorę udział w kursie uczenia maszynowego Andrew Nga i po kilku próbach nie byłem w stanie uzyskać poprawnej odpowiedzi na to pytanie. Prosimy o pomoc w rozwiązaniu tego problemu, chociaż przeszedłem poziom. Załóżmy, że uczniów wzięło udział w zajęciach, a klasa miała egzamin śródokresowy i...

14
Sieć neuronowa - wejście binarne vs dyskretne / ciągłe

Czy są jakieś dobre powody, aby preferować wartości binarne (0/1) zamiast dyskretnych lub ciągłych wartości znormalizowanych , np. (1; 3), jako dane wejściowe dla sieci sprzężenia zwrotnego dla wszystkich węzłów wejściowych (z propagacją wsteczną lub bez)? Oczywiście mówię tylko o danych...

14
Jakie są szybkie algorytmy obliczania skróconego SVD?

Ewentualnie od tematu tutaj, ale istnieje kilka ( jeden , dwa ) pytania związane już. Grzebanie w literaturze (lub wyszukiwanie google za pomocą Skróconych algorytmów SVD) ujawnia wiele artykułów, które wykorzystują obcięte SVD na różne sposoby i twierdzą (frustrujące, często bez cytowania), że...

14
Wyjście prognozy regresji logistycznej

Utworzyłem regresję logistyczną przy użyciu następującego kodu: full.model.f = lm(Ft_45 ~ ., LOG_D) base.model.f = lm(Ft_45 ~ IP_util_E2pl_m02_flg) step(base.model.f, scope=list(upper=full.model.f, lower=~1), direction="forward", trace=FALSE) Następnie wykorzystałem dane wyjściowe do stworzenia...

14
Jak uzyskać probabilistyczną interpretację AUC?

Dlaczego obszar pod krzywą ROC to prawdopodobieństwo, że klasyfikator uszereguje losowo wybraną „pozytywną” instancję (na podstawie uzyskanych prognoz) wyższą niż przypadkowo wybrana „pozytywna” instancja (z oryginalnej pozytywnej klasy)? W jaki sposób można udowodnić matematycznie to stwierdzenie...