Statystyki i duże zbiory danych

17
Ważona wariancja, jeszcze raz

Bezstronna ważona wariancja została już omówiona tutaj i gdzie indziej, ale nadal wydaje się, że istnieje zaskakująca ilość zamieszania. Wydaje się, że istnieje zgoda co do formuły przedstawionej w pierwszym linku, a także w artykule w Wikipedii . To również wygląda na wzór używany przez R,...

17
Jak wykonać ANCOVA w R.

Chcę przeprowadzić analizę ANCOVA danych dotyczących gęstości epifitów roślinnych. Na początku chciałbym wiedzieć, czy istnieje jakakolwiek różnica w gęstości rośliny między dwoma zboczami, jednym N i jednym S, ale mam inne dane, takie jak wysokość, otwartość czaszy i wysokość rośliny...

17
Jaki jest związek między

Zastanawiałem się, czy istnieje związek między a testem F.R2R2R^2 Zwykle i mierzy siłę związek liniowy w regresji.R2=∑(Y^t−Y¯)2/T−1∑(Yt−Y¯)2/T−1R2=∑(Y^t−Y¯)2/T−1∑(Yt−Y¯)2/T−1R^2=\frac {\sum (\hat Y_t - \bar Y)^2 / T-1} {\sum( Y_t - \bar Y)^2 / T-1} Test F tylko potwierdza hipotezę. Czy istnieje...

17
Jak zrozumieć efekt RBF SVM

Jak mogę zrozumieć, co robi jądro RBF w SVM? Rozumiem matematykę, ale czy jest sposób, aby poczuć, kiedy to jądro będzie przydatne? Czy wyniki z kNN byłyby powiązane z SVM / RBF, ponieważ RBF zawiera odległości wektorowe? Czy jest sposób, aby poczuć wielomianowe jądro? Wiem, że im wyższy wymiar,...

17
Pytania dotyczące zasady wiarygodności

Obecnie próbuję zrozumieć zasadę wiarygodności i, szczerze mówiąc, wcale jej nie rozumiem. Tak więc napiszę wszystkie moje pytania jako listę, nawet jeśli mogą to być dość podstawowe pytania. Co dokładnie oznacza wyrażenie „wszystkie informacje” w kontekście tej zasady? (ponieważ wszystkie...

17
Czy warto stosować zmienną daty w regresji?

Nie jestem przyzwyczajony do używania zmiennych w formacie daty w R. Zastanawiam się tylko, czy można dodać zmienną daty jako zmienną objaśniającą w modelu regresji liniowej. Jeśli to możliwe, jak możemy interpretować współczynnik? Czy to wpływ jednego dnia na zmienną wyniku? Zobacz moją istotę z...

17
Analogia korelacji Pearsona dla 3 zmiennych

Interesuje mnie, czy „korelacja” trzech zmiennych jest czymś, a jeśli tak, co by to było? Współczynnik korelacji momentu Pearsona E{(X−μX)(Y−μY)}Var(X)Var(Y)−−−−−−−−−−−−√E{(X−μX)(Y−μY)}Var(X)Var(Y)\frac{\mathrm{E}\{(X-\mu_X)(Y-\mu_Y)\}}{\sqrt{\mathrm{Var}(X)\mathrm{Var}(Y)}} Teraz pytanie...

17
Wybór funkcji za pomocą Losowych lasów

Mam zestaw danych zawierający głównie zmienne finansowe (120 funkcji, 4k przykładów), które są w większości wysoce skorelowane i bardzo głośne (na przykład wskaźniki techniczne), dlatego chciałbym wybrać około 20-30 do późniejszego użycia ze szkoleniem modelu (klasyfikacja binarna) - zwiększyć...

17
Do czego służą „efekty” funkcji w R?

Nie rozumiem wyjaśnienia w Rpliku pomocy dla efektów () : Dla modelu liniowego dopasowanego przez lmlubaov , efektami są nieskorelowane wartości pojedynczego stopnia swobody uzyskane przez rzutowanie danych na kolejne ortogonalne podprzestrzenie generowane przez rozkład QR podczas procesu...