Statystyki i duże zbiory danych

20
Testowanie znaczenia pików w gęstości widmowej

Czasami używamy wykresu gęstości widmowej do analizy okresowości w szeregach czasowych. Zwykle analizujemy fabułę poprzez kontrolę wzrokową, a następnie próbujemy wyciągnąć wnioski na temat okresowości. Ale czy statystycy opracowali jakiś test, aby sprawdzić, czy jakiekolwiek skoki na wykresie...

20
Budujesz model liniowy dla stosunku vs procent?

Załóżmy, że chcę zbudować model, aby przewidzieć pewien stosunek lub procent. Na przykład, powiedzmy, że chcę przewidzieć liczbę chłopców w porównaniu z dziewczynami, którzy wezmą udział w imprezie, a cechami imprezy, których mogę użyć w modelu, są między innymi ilość reklamy na imprezę, wielkość...

20
Prosta interpretacja wyników regresji liniowej

Przeprowadziłem prostą regresję liniową logarytmu naturalnego 2 zmiennych, aby ustalić, czy są one skorelowane. Moje wyniki są następujące: R^2 = 0.0893 slope = 0.851 p < 0.001 Jestem zdezorientowany. Patrząc na wartość , powiedziałbym, że dwie zmienne nie są skorelowane, ponieważ jest tak...

20
Pomysły na oprogramowanie „laboratoryjne”?

Jest to więc dziwne dopasowanie, choć naprawdę myślę, że jest dziwne dla każdej strony, więc pomyślałem, że wypróbuję to tutaj, wśród moich braci, którzy mają problemy z danymi. Przyszłam do epidemiologii i biostatystyki z biologii i nadal zdecydowanie mam pewne nawyki z tej dziedziny. Jednym z...

20
Metody ponownego próbkowania Careta

Korzystam z biblioteki caretw języku R do testowania różnych procedur modelowania. trainControlObiektu pozwala na określenie metody wielokrotnego pobierania próbek. Te sposoby są opisane w dokumentacji części 2.3 i obejmują: boot, boot632, cv, LOOCV, LGOCV, repeatedcvi oob. Chociaż niektóre z nich...

20
Kiedy upuścić termin z modelu regresji?

Czy ktoś może doradzić, czy następujące działania mają sens: Mam do czynienia ze zwykłym modelem liniowym z 4 predyktorami. Zastanawiam się, czy porzucić najmniej znaczący termin. Jego wartość wynosi nieco ponad 0,05. Opowiedziałem się za upuszczeniem go według następujących zasad: Pomnożenie...

20
Łączenie modeli uczenia maszynowego

Jestem trochę nowy w analizie danych / uczeniu maszynowym / itp. i czytałem o kilku sposobach łączenia wielu modeli i serii tego samego modelu w celu poprawy prognoz. Mam wrażenie, że po przeczytaniu kilku artykułów (często interesujących i świetnych z teorii i liter greckich, ale bez kodu i...