Statystyki i duże zbiory danych

15
Jakościowo czym jest Cross Entropy

To pytanie podaje ilościową definicję entropii krzyżowej pod względem jej wzoru. Szukam bardziej hipotetycznej definicji, wikipedia mówi: W teorii informacji entropia krzyżowa między dwoma rozkładami prawdopodobieństwa mierzy średnią liczbę bitów potrzebną do zidentyfikowania zdarzenia z...

15
Co to znaczy wyjaśniać wariancję?

W szczególności zastanawiam się, dlaczego mamy tę koncepcję wielokrotności R (którą rozumiem jako korelację między obserwowanymi i przewidywanymi wynikami w regresji wielokrotnej), a następnie osobną koncepcję kwadratu R, który jest po prostu kwadratem lub R. Zostałem poinformowany, że R-kwadrat...

15
SVM dla niezrównoważonych danych

Chcę spróbować użyć maszyn wektorów wsparcia (SVM) w moim zestawie danych. Zanim jednak spróbowałem rozwiązać problem, zostałem ostrzeżony, że maszyny SVM nie radzą sobie dobrze z bardzo niezrównoważonymi danymi. W moim przypadku mogę mieć aż 95-98% zera i 2-5% 1. Próbowałem znaleźć zasoby, które...

15
Jaka jest definicja dokładności Top-n?

Czytam artykuł naukowy na temat klasyfikacji obrazów. W wynikach eksperymentów mówią o dokładności 1 i 5, ale nigdy nie słyszałem o tym terminie, ani nie mogę go znaleźć za pomocą Google. Czy ktoś może podać mi definicję lub wskazać gdzieś?

15
Regresja grzbietowa - interpretacja bayesowska

Słyszałem, że regresję grzbietu można wyprowadzić jako średnią rozkładu z tyłu, jeśli uprzednio zostanie odpowiednio wybrany. Czy intuicja, że ​​ograniczenia określone przez współczynniki regresji przez wcześniejsze (np. Standardowe rozkłady normalne około 0) są identyczne / zastępuje karę...

15
Jak interpretować autokorelację

Obliczyłem autokorelację na danych szeregów czasowych wzorców ruchu ryby na podstawie jej pozycji: X ( x.ts) i Y ( y.ts). Korzystając z R, uruchomiłem następujące funkcje i stworzyłem następujące wykresy: acf(x.ts,100) acf(y.ts,100) Moje pytanie brzmi: jak interpretować te wykresy?...