Statystyki i duże zbiory danych

27
Co jest nie tak z T-SNE vs PCA w redukcji wymiarów za pomocą R?

Mam macierz liczb zmiennoprzecinkowych 336 x 256 (336 genomów bakteryjnych (kolumny) x 256 znormalizowanych częstotliwości tetranukleotydowych (wiersze), np. Każda kolumna daje 1). Dobre wyniki uzyskuje się, gdy uruchamiam analizę przy użyciu analizy składników zasadniczych. Najpierw obliczam...

27
Jak opisać statystyki w jednym zdaniu?

Kiedy zacząłem uczyć się statystyki, procedury takie jak test t, ANOVA, chi-kwadrat i regresja liniowa wydawały się być bardzo różnymi stworzeniami. Ale teraz zdaję sobie sprawę, że te procedury robią mniej więcej to samo. Podobnie wartości takie jak wariancja, reszty, błąd standardowy i średnia...