Statystyki i duże zbiory danych

21
Wprowadzenie do teorii miary

Chciałbym dowiedzieć się więcej o nieparametrycznych technikach bayesowskich (i pokrewnych). Mam doświadczenie w informatyce i chociaż nigdy nie brałem udziału w kursie teorii miary lub teorii prawdopodobieństwa, miałem ograniczone formalne szkolenie w zakresie prawdopodobieństwa i statystyki. Czy...

21
Jak używać wag w funkcji lm w R?

Zablokowana . To pytanie i odpowiedzi są zablokowane, ponieważ pytanie jest nie na temat, ale ma znaczenie historyczne. Obecnie nie akceptuje nowych odpowiedzi ani interakcji. Czy ktoś mógłby zaoferować jakieś wskazówki, jak używać weightsargumentu w lmfunkcji R....

21
Dlaczego wartość

tło Jednym z najczęściej używanych słabych wcześniejszych wariantów jest odwrotna gamma o parametrach (Gelman 2006) .α = 0,001 , β= 0,001α=0,001,β=0,001\alpha =0.001, \beta=0.001 Jednak rozkład ten ma 90% CI około .[ 3 × 1019, ∞ ][3)×1019,∞][3\times10^{19},\infty] library(pscl) sapply(c(0.05,...

21
Trudność testowania liniowości w regresji

W Modelowaniu statystycznym: The Two Cultures pisze Leo Breiman Obecnie stosowaną praktyką jest sprawdzanie dopasowania modelu danych za pomocą testów dopasowania i analizy resztkowej. W pewnym momencie, kilka lat temu, stworzyłem symulowany problem regresji w siedmiu wymiarach z kontrolowaną...

21
Dopasowanie modelu wykładniczego do danych

To pytanie zostało przeniesione z Przepełnienia stosu, ponieważ można na nie odpowiedzieć w ramach weryfikacji krzyżowej. Migrował 8 lat temu . Mam 2 zmienne, obie z klasy „numeryczne”: > head(y) [1] 0.4651804 0.6185849 0.3766175 0.5489810 0.3695258 0.4002567 >...

21
Regresja logistyczna dla szeregów czasowych

Chciałbym zastosować binarny model regresji logistycznej w kontekście przesyłania strumieniowego danych (wielowymiarowe szeregi czasowe), aby przewidzieć wartość zmiennej zależnej danych (tj. Wiersza), które właśnie nadeszły, biorąc pod uwagę wcześniejsze obserwacje. O ile mi wiadomo, regresja...