Statystyki i duże zbiory danych

15
Który algorytm klasyfikacji statystycznej może przewidzieć wartość prawda / fałsz dla sekwencji danych wejściowych?

Biorąc pod uwagę sekwencję danych wejściowych, muszę ustalić, czy sekwencja ta ma pewną pożądaną właściwość. Właściwość może być tylko prawdą lub fałszem, tzn. Istnieją tylko dwie możliwe klasy, do których może należeć sekwencja. Dokładny związek między sekwencją a właściwością jest niejasny, ale...

15
Partycjonowanie drzew w R: party vs. rpart

Minęło trochę czasu, odkąd spojrzałem na dzielenie drzew. Ostatnim razem, gdy robiłem takie rzeczy, lubię imprezę w R (stworzoną przez Hothorn). Idea wnioskowania warunkowego za pomocą próbkowania ma dla mnie sens. Ale rpart również miał apelację. W obecnej aplikacji (nie mogę podać szczegółów,...

15
Co to jest praktycznie dobry proces analizy danych?

Chciałbym poznać lub mieć referencje na temat procesu analizy, który większość analityków danych statystycznych przechodzi przez każdy projekt analizy danych. Jeśli utworzę „listę”, aby ukończyć projekt analizy danych, analityk musi: najpierw zbieraj wymagania dla projektu, wcześniej...

15
Klasyfikacja na podstawie danych o wysokiej zawartości tłuszczu

Muszę wyszkolić liniowy klasyfikator na moim laptopie z setkami tysięcy punktów danych i około dziesięcioma tysiącami funkcji. Jakie są moje opcje? Jaki jest obecny stan tego rodzaju problemu? Wygląda na to, że stochastyczny spadek gradientu jest obiecującym kierunkiem i mam wrażenie, że jest to...