Statystyki i duże zbiory danych

9
Ciekawe wyprowadzenie R do kwadratu

Wiele lat temu odkryłem tę tożsamość poprzez eksperymenty z danymi i transformacjami. Po wyjaśnieniu tego mojemu profesorowi statystyki przyszedł do następnej klasy z jednostronicowym dowodem przy użyciu notacji wektorowej i macierzowej. Niestety zgubiłem papier, który mi dał. (To było w 2007...

9
Jak sprawdzić medianę populacji?

Mam próbkę 250 jednostek. Rozkład jest asymetryczny. Chcę przetestować hipotezę, że mediana populacji różni się od 3,5, więc myślę, że odpowiedni byłby test z jedną próbą. Wiem, że test rang Wilcoxona nie jest odpowiedni, ponieważ rozkład nie jest symetryczny. Czy można użyć testu znakowego? Jeśli...

9
Jak zmienić kolejność danych 2D, aby uzyskać korelację?

Mam następujący prosty zestaw danych z dwiema zmiennymi ciągłymi; to znaczy: d = data.frame(x=runif(100,0,100),y = runif(100,0,100)) plot(d$x,d$y) abline(lm(y~x,d), col="red") cor(d$x,d$y) # = 0.2135273 Muszę zmienić dane tak, aby korelacja między zmiennymi wynosiła ~ 0,6. Muszę utrzymać...

9
Oblicz kwantyl sumy rozkładów z poszczególnych kwantyli

Załóżmy NNN niezależne zmienne losowe X1,...,XNX1,...,XNX_1, ..., X_N dla których kwantyle na pewnym określonym poziomie αα\alpha są znane na podstawie danych szacunkowych: α=P(X1<q1)α=P(X1<q1)\alpha = P(X_1 < q_1), ..., α=P(XN<qN)α=P(XN<qN)\alpha = P(X_N < q_N). Teraz zdefiniujmy...

9
Czy Monte Carlo == stosuje proces losowy?

Nigdy nie miałem formalnego kursu statystyki, ale z powodu moich badań ciągle napotykam artykuły, które stosują kilka pojęć statystycznych. Często widzę opis procesu Monte Carlo zastosowanego do danej sytuacji, a to, co mogę zebrać 9 na 10 razy, sprowadza się do zwykłego losowego pokolenia...