Statystyki i duże zbiory danych

11
Automatycznie twórz podsumowanie według zmiennej czynnikowej w R

Mam ramkę danych, jak poniżej: case simulation temp plank oxygen 1 1 1 8 7 11 2 2 1 16 10 15 ... 17 17 2 26 12 17 18 18 2 15 8 12 19 19 2 28 11 21 20 20 2 24 6 14 Chciałbym uzyskać podsumowania podzielone przez poziomy zmiennej symulacyjnej. Na przykład, chciałbym średnią tempdla symulacji == 1...

11
Jak testujesz implementację k-średnich?

Uwaga: zamieściłem to pytanie na Stackoverflow, ale pomyślałem, że może lepiej pasować do tej platformy. Jak testujesz własną implementację k-średnich dla wielowymiarowych zestawów danych? Myślałem o uruchomieniu już istniejącej implementacji (tj. Matlaba) na danych i porównaniu wyników z moim...

11
Oszacowanie parametrów dynamicznego modelu liniowego

Chcę zaimplementować (w R) następujący bardzo prosty dynamiczny model liniowy, dla którego mam 2 nieznane parametry zmieniające się w czasie (wariancja błędu obserwacji i wariancja błędu stanu ). ϵ 2 tϵ1tϵt1\epsilon^1_tϵ2)tϵt2\epsilon^2_t Ytθt + 1==θt+ ϵ1tθt+ ϵ2)tYt=θt+ϵt1θt+1=θt+ϵt2...

11
Wariancja dwóch ważonych zmiennych losowych

Pozwolić: Odchylenie standardowe zmiennej losowej A=σ1=5A=σ1=5A =\sigma_{1}=5 Odchylenie standardowe zmiennej losowej B=σ2=4B=σ2=4B=\sigma_{2}=4 Zatem wariant A + B jest następujący: Var(w1A+w2B)=w21σ21+w22σ22+2w1w2p1,2σ1σ2Var(w1A+w2B)=w12σ12+w22σ22+2w1w2p1,2σ1σ2Var(w_{1}A+w_{2}B)=...

11
Ile informacji możesz wydobyć z imienia?

Imię: pierwsze, ewentualnie środkowe i nazwisko. Jestem ciekawy, ile informacji możesz wydobyć z nazwy, używając publicznie dostępnych zestawów danych. Wiem, że możesz uzyskać następujące z dowolnym między niskim a wysokim prawdopodobieństwem (w zależności od danych wejściowych) przy użyciu danych...

11
Wykryj zmiany w szeregach czasowych

Natknąłem się na zdjęcie prototypu aplikacji, który znajduje znaczące zmiany („trendy” - nie wzrosty / wartości odstające) w danych o ruchu: Chcę napisać program (Java, opcjonalnie R), który jest w stanie zrobić to samo - ale ponieważ moje umiejętności statystyczne są nieco zardzewiałe, muszę...

11
Mierzenie regresji do średniej w trafianiu do domu

Każdy, kto podąży za baseballem, prawdopodobnie słyszał o nieoczekiwanym występie Jose Bautisty w Toronto typu MVP. W ciągu czterech poprzednich lat osiągnął około 15 przebiegów u siebie w sezonie. W zeszłym roku osiągnął 54 lata, a liczba ta przekroczyła zaledwie 12 graczy w historii baseballu. W...

11
Prognozuj po uruchomieniu funkcji mlogit w R.

Oto, co chcę zrobić, ale wydaje się, że nie ma predictmetody dla mlogit. Jakieś pomysły? library(mlogit) data("Fishing", package = "mlogit") Fish <- mlogit.data(Fishing, varying = c(2:9), shape = "wide", choice = "mode") Fish_fit<-Fish[-1,] Fish_test<-Fish[1,] m <- mlogit(mode ~price+...