Statystyki i duże zbiory danych

10
Porównanie podłużne dwóch rozkładów

Mam wyniki testu krwi przeprowadzonego 2500 osób cztery razy w odstępach sześciomiesięcznych. Wyniki składają się przede wszystkim z dwóch miar odpowiedzi immunologicznej - jednej w obecności niektórych antygenów gruźlicy, drugiej w nieobecności. Obecnie każdy test ocenia się pozytywnie lub...

10
Jak radzić sobie z pytaniem ankietowym z wieloma odpowiedziami?

Mam zestaw danych, w którym pytam ludzi, czy byli w określonych miejscach (np. A, B, C, D), i mogą dokonać więcej niż jednego wyboru, następnie próbka jest pobierana z nosa, aby sprawdzić, czy są zarażeni niektórymi choroba. Muszę dowiedzieć się o względnym ryzyku zarażenia osoby udającej się w...

10
Przetłumacz R na C ++ (ewentualnie z Rcpp) [zamknięte]

Zamknięte. To pytanie jest nie na temat . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby było tematem dotyczącym weryfikacji krzyżowej. Zamknięte 2 lata temu . Chciałbym nauczyć się korzystać z Rcpp ....

10
Różnica między GLS i SUR

Czytałem trochę o Uogólnionych Najmniejszych Kwadratach (GLS) i próbowałem powiązać je z moim podstawowym tłem ekonometrycznym. Pamiętam, że w szkole podstawowej korzystałem z Regresji Pozornie Niepowiązanej (SUR), która wydaje się nieco podobna do GLS. W jednym artykule natknąłem się nawet na SUR...

10
Czy w R „glmnet” pasuje do przechwytywania?

Mam sylwetkę modelu liniowego w R użyciem glmnet. Oryginalny (nieregulowany) model został dopasowany przy użyciu lmi nie miał stałego terminu (tj. Był w formie lm(y~0+x1+x2,data)). glmnetbierze macierz predyktorów i wektor odpowiedzi. Czytam glmnetdokumentację i nie mogę znaleźć wzmianki o tym...

10
Pakiet R do łączenia poziomów czynników do analizy danych?

Zastanawiasz się, czy ktoś natknął się na pakiet / funkcję w R, która połączy poziomy współczynnika, którego proporcja wszystkich poziomów w współczynniku jest mniejsza niż pewien próg? Konkretnie, jednym z pierwszych kroków w przygotowaniu danych, które przeprowadzam, jest zwinięcie razem...

10
Generuj losowe wartości wielowymiarowe z danych empirycznych

Pracuję nad funkcją Monte Carlo do wyceny kilku aktywów o częściowo skorelowanych zwrotach. Obecnie właśnie generuję macierz kowariancji i przesyłam do rmvnorm()funkcji w R. (Generuje skorelowane wartości losowe). Jednak patrząc na rozkłady zysków danego składnika aktywów, zwykle nie jest on...

10
Dobry tekst do ponownego próbkowania?

Czy grupa może polecić dobry tekst / zasób wprowadzający do zastosowanych technik ponownego próbkowania? W szczególności interesują mnie alternatywy dla klasycznych testów parametrycznych (np. Testy t, ANOVA, ANCOVA) do porównywania grup w przypadku wyraźnego naruszenia założeń takich jak...

10
Rysowanie linii regresji częściowej

Czy istnieje sposób wykreślenia linii regresji takiego fragmentowego modelu, inny niż użycie linesdo wykreślenia każdego segmentu osobno lub użycie geom_smooth(aes(group=Ind), method="lm", fill=FALSE)? m.sqft <- mean(sqft) model <- lm(price~sqft+I((sqft-m.sqft)*Ind)) # sqft, price:...