Statystyki i duże zbiory danych

50
Jaka jest intuicja stojąca za SVD?

Czytałem o rozkładzie wartości pojedynczej (SVD). W prawie wszystkich podręcznikach wspomniano, że rozkłada macierz na trzy macierze o podanej specyfikacji. Ale jaka jest intuicja dzielenia macierzy w takiej formie? PCA i inne algorytmy redukcji wymiarów są intuicyjne w tym sensie, że algorytm ma...

49
Bootstrap kontra scyzoryk

Zarówno metody bootstrap, jak i jackknife mogą być użyte do oszacowania błędu systematycznego i błędu standardowego oszacowania, a mechanizmy obu metod ponownego próbkowania nie różnią się znacznie: próbkowanie z wymianą vs. pomijanie jednej obserwacji na raz. Jednak scyzoryk nie jest tak popularny...

49
Czy „średnia ocena” Amazon jest myląca?

Jeśli dobrze rozumiem, oceny książek w skali 1-5 to wyniki Likerta. Oznacza to, że 3 dla mnie niekoniecznie musi być 3 dla kogoś innego. To IMO w skali porządkowej. Tak naprawdę nie należy uśredniać skal porządkowych, ale zdecydowanie można wybrać tryb, medianę i percentyle. Czy więc „w porządku”...

49
Losowy czas obliczania lasu w R.

Korzystam z pakietu imprezowego w R z 10 000 wierszy i 34 funkcjami, a niektóre funkcje czynnikowe mają ponad 300 poziomów. Czas przetwarzania jest za długi. (Jak dotąd zajęło to 3 godziny i jeszcze się nie skończyło.) Chcę wiedzieć, które elementy mają duży wpływ na czas obliczeń losowego lasu....

49
Jaki jest najlepszy sposób na zapamiętanie różnicy między czułością, specyficznością, precyzją, dokładnością i pamięcią?

Pomimo tego, że widziałem te terminy 502847894789 razy, nie mogę przez całe życie zapamiętać różnicy między czułością, swoistością, precyzją, dokładnością i pamięcią. Są to dość proste pojęcia, ale nazwy są dla mnie bardzo nieintuicyjne, więc ciągle się mylę. Jaki jest dobry sposób myślenia o tych...

48
Jaka jest różnica między NaN a NA?

Chciałbym wiedzieć, dlaczego niektóre języki, takie jak R, mają zarówno NA, jak i NaN. Jakie są różnice, czy są jednakowo takie same? Czy naprawdę trzeba mieć