Statystyki i duże zbiory danych

12
Co maksymalizują pierwsze

W analizie głównych składników pierwsze głównych składników to k ortogonalne kierunki o maksymalnej wariancji. Innymi słowy, pierwszy główny składnik jest wybrany jako kierunek maksymalnej wariancji, drugi główny składnik jest wybrany jako kierunek ortogonalny do pierwszego z maksymalną wariancją i...

12
Prognozowanie binarnych szeregów czasowych

Mam binarne szeregi czasowe z 1, gdy samochód się nie porusza, i 0, gdy samochód się porusza. Chcę zrobić prognozę dla horyzontu czasowego do 36 godzin do przodu i dla każdej godziny. Moje pierwsze podejście polegało na użyciu Naiwnego Bayesa przy użyciu następujących danych wejściowych: t-24...

12
Jaki jest dobry wskaźnik stopnia naruszenia normalności i jakie opisowe etykiety można przypisać do tego indeksu?

Kontekst: W poprzednim pytaniu @Robbie zadał w badaniu z około 600 przypadków, dlaczego testy normalności sugerują znaczną nienormalność, a wykresy sugerują rozkład normalny . Kilka osób zauważyło, że testy istotności normalności nie są zbyt przydatne. Przy małych próbkach takie testy nie mają...

12
Estymator dla rozkładu dwumianowego

Jak definiujemy estymator dla danych pochodzących z rozkładu dwumianowego? W przypadku bernoulli mogę myśleć o estymatorze szacującym parametr p, ale w przypadku dwumianu nie widzę, jakie parametry należy oszacować, gdy n charakteryzuje rozkład. Aktualizacja: Przez estymator rozumiem funkcję...