Statystyki i duże zbiory danych

18
Ile razy powinniśmy powtarzać K-fold CV?

Natknąłem się na ten wątek, patrząc na różnice między ładowaniem początkowym a weryfikacją krzyżową - przy okazji, świetna odpowiedź i referencje. Zastanawiam się teraz, czy gdybym powtórzył 10-krotne CV, aby obliczyć dokładność klasyfikatora, ile razy n powinienem to powtórzyć? Czy n zależy od...

18
W jaki sposób MANOVA jest powiązana z LDA?

W kilku miejscach widziałem twierdzenie, że MANOVA jest jak ANOVA plus liniowa analiza dyskryminacyjna (LDA), ale zawsze była wykonywana w sposób machający ręką. Chciałbym wiedzieć, co to dokładnie znaczy. Znalazłem różne podręczniki opisujące wszystkie szczegóły obliczeń MANOVA, ale wydaje się,...

18
Jakie są zalety jądra PCA w porównaniu ze standardowym PCA?

Chcę zaimplementować algorytm w dokumencie, który używa jądra SVD do dekompozycji macierzy danych. Czytałem więc materiały na temat metod jądra i PCA jądra itp. Ale wciąż jest to dla mnie bardzo niejasne, szczególnie jeśli chodzi o szczegóły matematyczne, i mam kilka pytań. Dlaczego metody jądra?...

18
Jak wybielić dane za pomocą analizy głównych składników?

Chcę przekształcić moje dane tak, aby wariancje były równe jeden, a kowariancje były równe zero (tzn. Chcę wybielić dane). Ponadto średnie powinny wynosić zero.XX\mathbf X Wiem, że się tam dostanę, wykonując standaryzację Z i transformację PCA, ale w jakiej kolejności mam to zrobić? Powinienem...

18
Kiedy metody bayesowskie są lepsze od Frequentist?

Naprawdę chcę dowiedzieć się o technikach bayesowskich, więc starałem się trochę nauczyć. Trudno mi jednak dostrzec, kiedy stosowanie technik bayesowskich kiedykolwiek daje przewagę nad metodami Frequentist. Na przykład: Widziałem w literaturze trochę o tym, jak niektórzy wykorzystują pouczające...