Statystyki i duże zbiory danych

9
Pierwsze kroki z biclustering

Przeprowadziłem przypadkowe badania internetowe dotyczące biclusters. (Przeczytałem kilka razy artykuł na Wiki). Jak dotąd wydaje się, że istnieje kilka definicji lub standardowej terminologii. Zastanawiałem się, czy są jakieś standardowe gazety lub książki, które powinien przeczytać każdy, kto...

9
Jak wyszukać procedurę statystyczną w języku R?

Czy istnieje pakiet R, strona internetowa lub polecenie, które pozwolą wyszukać określoną procedurę statystyczną, której pragną? Na przykład, jeśli chciałbym znaleźć pakiet z transformacją Box-Coxa, strona internetowa / pakiet / polecenie może zwrócić „MASS” i skierować mnie do...

9
Czy poprawnie określam swój model Lmer?

Przeszukałem Google i tę stronę i nadal jestem zdezorientowany co do funkcji lmer w bibliotece lme4. Mam dane zebrane z różnych oddziałów psychiatrycznych, które mają wielopoziomową strukturę. Aby uprościć, wybiorę dwie zmienne poziomu 2 i dwie zmienne poziomu 1, chociaż tak naprawdę mam kilka...

9
Realizacja współczynnika częściowego wyznaczenia

Czy ktoś ma sugestie lub pakiety, które obliczą współczynnik częściowego określenia? Współczynnik częściowego wyznaczenia można zdefiniować jako procent zmienności, którego nie można wyjaśnić w modelu zredukowanym, ale można go wyjaśnić za pomocą predyktorów określonych w modelu pełnym (er). Ten...

9
Czy do wyboru funkcji można użyć jądra PCA?

Czy można używać analizy głównych składników jądra (kPCA) do latentnego indeksowania semantycznego (LSI) w taki sam sposób, jak w przypadku PCA? Wykonuję LSI in R za pomocą prcompfunkcji PCA i wydobywam cechy z najwyższymi obciążeniami od pierwszegokkkskładniki. Dzięki temu uzyskuję funkcje...

9
Dodatni rozkład stabilny w R.

Pozytywne rozkłady stabilne są opisane przez cztery parametry: parametr skośności , parametr skali , parametr lokalizacji i tak dalej - wywołany parametr indeksu . Gdy wynosi zero, rozkład jest symetryczny wokół , gdy jest dodatni (względnie ujemny), rozkład jest przekrzywiony w prawo (odpowiednio...

9
Do czego służy błąd standardowy?

Korzystam z samouczka, który znalazłem i wykreślam wartości średnie wraz ze standardowymi błędami, aby pokazać moje dane. Ale mam problem z omówieniem wyników. Moja fabuła jest pokazana poniżej: niektóre standardowe błędy (pokazane jako pasek błędów) różnią się znacznie, a niektóre z nich są bardzo...

9
Funkcje dyskretne: zakres przedziału ufności?

Jak obliczyć pokrycie przedziału dyskretnego? Co wiem jak to zrobić: Gdybym miał model ciągły, mógłbym zdefiniować 95% przedział ufności dla każdej z moich przewidywanych wartości, a następnie zobaczyć, jak często rzeczywiste wartości mieściły się w przedziale ufności. Mogę stwierdzić, że tylko...