Statystyki i duże zbiory danych

14
Dynamiczne systemy rekomendujące

Recommender system będzie mierzyć korelację między ocenie różnych użytkowników i zaleceń dochodowości dla danego użytkownika na temat elementów, które mogą być interesujące dla niego. Jednak gusta zmieniają się z czasem, więc stare oceny mogą nie odzwierciedlać obecnych preferencji i odwrotnie....

14
Pytanie o regresję logistyczną

Chcę uruchomić binarną regresję logistyczną, aby modelować obecność lub brak konfliktu (zmienna zależna) z zestawu zmiennych niezależnych w okresie 10 lat (1997-2006), przy czym każdego roku ma 107 obserwacji. Moi niezależni to: degradacja gruntów (kategoryczna dla 2 rodzajów degradacji); wzrost...

14
Co to jest losowość?

W prawdopodobieństwie i statystyce często stosuje się pojęcia „losowości” i „losowości”. Często pojęcie zmiennej losowej służy do modelowania zdarzeń, które występują z powodu przypadku. Moje pytanie dotyczy terminu „losowy”. Co jest losowe? Czy przypadkowość naprawdę istnieje? Jestem ciekawy, co...

14
Co oznaczają strzałki w biplocie PCA?

Rozważ następujący dwupłat PCA: library(mvtnorm) set.seed(1) x <- rmvnorm(2000, rep(0, 6), diag(c(5, rep(1,5)))) x <- scale(x, center=T, scale=F) pc <- princomp(x) biplot(pc) Zostało narysowanych kilka czerwonych strzałek, co one oznaczają? Wiedziałem, że pierwsza strzałka oznaczona...

14
Wyjaśnianie regresji kwantylowej niestatystom

Niedawno przedłożyłem artykuł, w którym zastosowałem regresję kwantową, do czasopisma psychologicznego. Chociaż myślałem, że włożyłem już wystarczająco dużo uwagi w wyraźną prezentację regresji kwantowej, recenzenci poprosili o lepsze wyjaśnienia techniki regresji kwantowej, znając jedynie...