Statystyki i duże zbiory danych

32
Jak R radzi sobie z brakującymi wartościami w lm?

Chciałbym regresować wektor B względem każdej kolumny w macierzy A. Jest to trywialne, jeśli nie ma brakujących danych, ale jeśli macierz A zawiera brakujące wartości, to moja regresja w stosunku do A jest ograniczona i obejmuje tylko wiersze, w których wszystkie wartości są obecne (domyślne...

32
Jak znaleźć przedziały ufności dla ocen?

„ Jak nie sortować według średniej oceny ” Evana Millera proponuje użycie dolnej granicy przedziału ufności, aby uzyskać sensowny łączny „wynik” dla ocenianych pozycji. Działa jednak z modelem Bernoulli: oceny są albo kciuki w górę, albo kciuki w dół. Jaki rozsądny przedział ufności należy...

32
Czy istnieje projekt Euler podobny do uczenia maszynowego?

Odkryłem, że Project Euler http://projecteuler.net/ jest niezwykle przydatny w nauce języków programowania. Czy istnieje podobna strona do uczenia maszynowego? Widziałem http://www.kaggle.com/ , ale nie jest tak dostępny dla początkujących jak Project

32
Dlaczego R miałby zwracać NA jako współczynnik lm ()?

Dopasowuję lm()model do zestawu danych, który zawiera wskaźniki dla kwartału finansowego (I kw., II kw., III kw., Domyślnie ustawiam Q4). Za pomocą lm(Y~., data = data) otrzymuję NAjako współczynnik dla Q3 i ostrzeżenie, że jedna zmienna została wykluczona z powodu osobliwości. Czy muszę dodać...

32
Regresja logistyczna jądra a SVM

Jak wiadomo wszystkim, SVM może używać metody jądra do rzutowania punktów danych w wyższych przestrzeniach, aby punkty można było oddzielić przestrzenią liniową. Ale możemy również użyć regresji logistycznej, aby wybrać tę granicę w przestrzeni jądra, więc jakie są zalety SVM? Skoro SVM używa...

32
Porównanie dwóch modeli za pomocą funkcji anova () w języku R

Z dokumentacji dla anova(): Po podaniu sekwencji obiektów „anova” testuje modele względem siebie w podanej kolejności ... Co to znaczy testować modele ze sobą? A dlaczego kolejność ma znaczenie? Oto przykład z samouczka GenABEL : > modelAdd = lm(qt~as.numeric(snp1)) > modelDom =...