Statystyki i duże zbiory danych

12
Interpretacja modelu regresji logistycznej z wieloma predyktorami

Przeprowadziłem wielowymiarową regresję logistyczną ze zmienną zależną Ybędącą śmiercią w domu opieki w pewnym okresie wejścia i otrzymałem następujące wyniki (zwróć uwagę, że zmienne zaczynają się w Anim, to ciągła wartość, podczas gdy te rozpoczynające się Bsą kategoryczne): Call: glm(Y ~ A1 +...

12
Kryteria wyboru „najlepszego” modelu w ukrytym modelu Markowa

Mam zestaw danych szeregów czasowych, do którego próbuję dopasować ukryty model Markowa (HMM) w celu oszacowania liczby stanów ukrytych w danych. Mój pseudo-kod do tego jest następujący: for( i in 2 : max_number_of_states ){ ... calculate HMM with i states ... optimal_number_of_states =...

12
Co to jest stacjonarny proces drugiego rzędu?

Zastanawiałem się, jak zdefiniowano jego „stacjonarny proces drugiego rzędu” we Wstępie do szeregów czasowych i prognoz Brockwella i Davisa : Klasa modeli liniowych szeregów czasowych, która obejmuje klasę modeli autoregresyjnej średniej ruchomej (ARMA), stanowi ogólne ramy do badania procesów...

12
Model mieszany z 1 obserwacją na poziom

Dopasowuję model efektów losowych glmerdo niektórych danych biznesowych. Celem jest analiza wyników sprzedaży przez dystrybutora, z uwzględnieniem różnic regionalnych. Mam następujące zmienne: distcode: identyfikator dystrybutora z około 800 poziomami region: identyfikator geograficzny...

12
Osiągalne korelacje dla wykładniczych zmiennych losowych

Jaki jest zakres możliwych do uzyskania korelacji dla pary wykładniczo rozkładanych zmiennych losowych i , gdzie to parametry stawki?X 2 ∼ E x p ( λ 2 ) λ 1 , λ 2 > 0X1∼Exp(λ1)X1∼Exp(λ1)X_1 \sim {\rm Exp}(\lambda_1)X2∼Exp(λ2)X2∼Exp(λ2)X_2 \sim {\rm Exp}(\lambda_2)λ1,λ2>0λ1,λ2>0\lambda_1,...

12
Testowanie hipotez za pomocą Big Data

Jak przeprowadzasz testy hipotez z użyciem dużych zbiorów danych? Napisałem następujący skrypt MATLAB, aby podkreślić moje zamieszanie. Wystarczy wygenerować dwie losowe serie i przeprowadzić prostą regresję liniową jednej zmiennej na drugiej. Wykonuje tę regresję kilka razy, używając różnych...