Statystyki i duże zbiory danych

13
Regresja liniowa, gdy znasz tylko

Załóżmy, że .Xβ=YXβ=YX\beta =Y Nie wiemy dokładnie, tylko jego korelację z każdego czynnika prognostycznego, .YYYXtYXtYX^\mathrm{t}Y Zwykłym rozwiązaniem najmniejszych kwadratów (OLS) jest i nie ma problemu.β=(XtX)−1XtYβ=(XtX)−1XtY\beta=(X^\mathrm{t} X)^{-1} X^\mathrm{t}Y Załóżmy jednak, że jest...

13
Prognozy za pomocą glmnet w R

Próbuję modelować niektóre dane przy użyciu glmnetpakietu w R. Załóżmy, że mam następujące dane training_x <- data.frame(variable1 = c(1, 2, 3, 2, 3), variable2 = c(1, 2, 3, 4, 5)) y <- c(1, 2, 3, 4, 5) (Jest to uproszczenie; moje dane są znacznie bardziej skomplikowane.) Następnie użyłem...

13
Pomóż mi zrozumieć wartości w Bayesian glm

Próbuję uruchomić Bayesa logit na dane tutaj . Używam bayesglm()w armpakiecie w R. Kodowanie jest dość proste: df = read.csv("http://dl.dropbox.com/u/1791181/bayesglm.csv", header=T) library(arm) model = bayesglm(PASS ~ SEX + HIGH, family=binomial(link="logit"), data=df) summary(model) daje...

13
Poszukiwanie prawdziwej ilustracji cytatu Fishera na temat DoE

Mój zespół i ja chcielibyśmy przedstawić niestatystom firmy prezentację na temat użyteczności projektowania eksperymentów. Ci statystycy są również naszymi klientami i zwykle nie konsultują się z nami przed zebraniem swoich danych. Czy znasz jakieś prawdziwe przykłady, które dobrze zilustrują...

13
Jak mogę użyć wartości do przetestowania założenia liniowości w analizie regresji wielokrotnej?

Poniższe wykresy są resztkowymi wykresami rozproszenia testu regresji, dla których z pewnością spełnione zostały już założenia dotyczące „normalności”, „homoscedastyczności” i „niezależności”! Do testowania założenia „liniowości” , chociaż patrząc na wykresy, można domyślić się, że związek jest...