Statystyki i duże zbiory danych

10
Wizualizacja kombinacji 2 liter

Odpowiedzi na to pytanie dotyczące SO zwróciły zestaw około 125 jedno- lub dwuliterowych nazw: /programming/6979630/what-1-2-letter-object-names-conflict-with-existing -r-objects [1] "Ad" "am" "ar" "as" "bc" "bd" "bp" "br" "BR" "bs" "by" "c" "C" [14] "cc" "cd" "ch" "ci" "CJ" "ck" "Cl" "cm"...

10
Regresja liniowa z czynnikami w R

Próbuję zrozumieć, jak dokładnie działają czynniki w R. Powiedzmy, że chcę uruchomić regresję przy użyciu przykładowych danych w R: > data(CO2) > colnames(CO2) [1] "Plant" "Type" "Treatment" "conc" "uptake" > levels(CO2$Type) [1] "Quebec" "Mississippi" > levels(CO2$Treatment) [1]...

10
Poprawa klasyfikacji cukrzycy SVM

Używam SVM do przewidywania cukrzycy. Używam do tego zestawu danych BRFSS . Zestaw danych ma wymiary i jest przekrzywiony. Procent s w zmiennej docelowej wynosi 11 %, podczas gdy s stanowią pozostałe 89 % .432607 × 136432607×136432607 \times 136Y11 %11%11\%N89 %89%89\% Korzystam tylko 15z...

10
Jak porównać dwie lub więcej macierzy korelacji?

Mam macierze korelacji obliczone z zestawami danych danych (zaobserwowanych) za pomocą funkcji MATLAB .P.P.P( n × n )(n×n)(n \times n)P.P.P( m × n )(m×n)(m \times n)corrcoef Jak porównać i przeanalizować te macierze korelacji względem siebie?P.P.P Jakie są testy, metody i / lub punkty...

10
Filtr Kalmana a wygładzanie splajnów

P: Dla jakich danych właściwe jest stosowanie modelowania w przestrzeni stanów i filtrowania Kalmana zamiast wygładzania splajnów i odwrotnie? Czy istnieje jakaś relacja równoważności między nimi? Próbuję uzyskać ogólne zrozumienie, w jaki sposób te metody pasują do siebie. Przeglądałem nowe...

10
vcovHC, vcovHAC, NeweyWest - jakiej funkcji użyć?

Próbuję zaktualizować mój model oparty na lm (), aby uzyskać poprawne standardowe błędy i testy. Jestem naprawdę zdezorientowany, której matrycy VC użyć. Do sandwichoferty pakietowe vcovHC, vcovHACi NeweyWest. Podczas gdy te pierwsze uwzględniają tylko heteroskedastyczność, drugie dwa uwzględniają...

10
Moc dla testu t dwóch próbek

Próbuję zrozumieć obliczenia mocy dla przypadku dwóch niezależnych próbnych testów t (nie zakładając równych wariancji, więc użyłem Satterthwaite). Oto schemat, który znalazłem, aby pomóc zrozumieć proces: Więc założyłem, że biorąc pod uwagę następujące informacje o dwóch populacjach i biorąc...