Statystyki i duże zbiory danych

21
Skąd nazwa „jądro” w statystykach i ML?

Zostało to zadane na innych stronach SE w kontekście systemów operacyjnych i algebry liniowej, ale to samo pytanie mnie martwi w odniesieniu do metod jądra używanych w statystyce i uczeniu maszynowym. Często mówi się, że jądra, np. W szacowaniu gęstości jądra lub SVM, reprezentują pewne...

21
Czym dokładnie jest ziarno w generatorze liczb losowych?

Próbowałem użyć zwykłego wyszukiwania w Google itp., Ale większość odpowiedzi, które znalazłem, są albo niejasne, albo specyficzne dla języka / biblioteki, takie jak Python lub C ++ stdlib.hitp. Szukam agnostycznej, matematycznej odpowiedzi na język, a nie specyfiki biblioteki. Na przykład wielu...

20
Jakie są prawidłowe wartości precyzji i przywołania w przypadkach krawędzi?

Precyzja jest zdefiniowana jako: p = true positives / (true positives + false positives) Czy jest to prawidłowe, że, jak true positivesi false positivespodejście 0, precyzja zbliża 1? To samo pytanie do przypomnienia: r = true positives / (true positives + false negatives) Obecnie wdrażam...

20
Czy mój meteorolog jest dokładny?

Pytanie, które martwiło mnie przez jakiś czas, na które nie wiem jak odpowiedzieć: Każdego dnia mój meteorolog daje procentową szansę na deszcz (załóżmy, że obliczono go na 9000 cyfr i nigdy nie powtórzył żadnej liczby). Każdego dnia pada albo nie pada. Mam lata danych - procent szans względem...

20
Algorytmy Metropolis-Hastings stosowane w praktyce

Czytałem dziś blog Christiana Roberta i całkiem podobał mi się nowy algorytm Metropolis-Hastings, o którym rozmawiał. Wydawało się proste i łatwe do wdrożenia. Ilekroć koduję MCMC, mam tendencję do trzymania się bardzo podstawowych algorytmów MH, takich jak niezależne ruchy lub losowe spacery na...

20
Jak połączyć przedziały ufności dla komponentu wariancji modelu z efektami mieszanymi, gdy używana jest wielokrotna imputacja

Logiką wielokrotnej imputacji (MI) jest przypisywanie brakujących wartości nie jeden raz, ale kilka razy (zwykle M = 5) razy, co skutkuje M zakończonymi zestawami danych. M zakończonych zestawów danych jest następnie analizowanych metodami kompletnych danych, na podstawie których szacunki M i ich...

20
Dobry zasób, aby zrozumieć ANOVA i ANCOVA?

Prowadzę eksperymenty na papierze i szukam interesującej książki / strony internetowej, aby właściwie zrozumieć, jak działają ANOVA i ANCOVA. Mam dobre doświadczenie matematyczne, więc niekoniecznie potrzebuję wulgarnych wyjaśnień. Chciałbym również wiedzieć, jak ustalić, kiedy użyć ANOVA zamiast...