Statystyki i duże zbiory danych

18
Prosty język oznaczeń „zależnych” i „niezależnych” testów w literaturze z wieloma porównaniami?

Zarówno w literaturze dotyczącej wskaźnika błędu rodzinnego (FWER), jak i wskaźnika fałszywego wykrywania (FDR), określone metody kontrolowania FWER lub FDR są odpowiednie do testów zależnych lub niezależnych. Na przykład w artykule z 1979 r. „Prosta sekwencyjnie wielokrotna procedura testowa...

18
Umieszczanie strzałek na biplocie PCA

Szukam zaimplementować biplot do analizy głównych składników (PCA) w JavaScript. Moje pytanie brzmi: jak określić współrzędne strzałek z wyjścia U,V,DU,V,DU,V,D rozkładu pojedynczego wektora (SVD) macierzy danych? Oto przykładowy dwupłat wyprodukowany przez

18
Wygładzanie - kiedy go używać, a kiedy nie?

Istnieje dość stary post na blogu Williama Briggsa, który analizuje pułapki wygładzania danych i przenoszenia tych wygładzonych danych do analizy. Kluczowym argumentem jest mianowicie: Jeśli w chwili szaleństwa robisz gładkie dane szeregów czasowych i używasz ich jako danych wejściowych do...

18
Interpretacja testu zanurzeniowego Hartigansa

Chciałbym znaleźć sposób na oszacowanie intensywności bimodalności niektórych rozkładów, które uzyskałem empirycznie. Z tego, co przeczytałem, wciąż trwa debata na temat sposobu kwantyfikacji bimodalności. Zdecydowałem się na test zanurzeniowy Hartigansa, który wydaje się być jedynym dostępnym na R...

18
Sens niezależnej analizy komponentów

Widziałem i podobało mi się pytanie Zrozumienie analizy głównych składników , a teraz mam to samo pytanie dotyczące analizy niezależnych składników. Chcę zadać kompleksowe pytanie na temat intuicyjnych sposobów rozumienia ICA? Chcę to zrozumieć . Chcę to zrozumieć. Chcę to poczuć. Mocno w to...