Statystyki i duże zbiory danych

10
Wariancja rezystorów równolegle

Załóżmy, że masz zestaw rezystorów R, z których wszystkie są rozmieszczone ze średnią μ i wariancją σ. Rozważ odcinek obwodu o następującym układzie: (r) || (r + r) || (r + r + r). Równoważny opór każdej części to r, 2r i 3r. Wariancja każdej sekcji wynosiłaby wtedy σ2σ2σ^2 , 2σ22σ22σ^2 ,...

10
Dopasowanie rozkładu log-normalnego w R vs. SciPy

Dopasowałem logarytmiczny model za pomocą R z zestawem danych. Wynikowymi parametrami były: meanlog = 4.2991610 sdlog = 0.5511349 Chciałbym przenieść ten model do Scipy, z którego nigdy wcześniej nie korzystałem. Korzystając z Scipy, udało mi się uzyskać kształt i skalę 1 oraz...

10
O korelacji kopenetycznej dla grupowania dendrogramu

Rozważ kontekst klastrowania dendrogramu. Nazwijmy pierwotne odmienności odległościami między jednostkami. Po skonstruowaniu dendrogramu definiujemy khenetyczną odmienność między dwoma osobami jako odległość między skupieniami, do których te osoby należą. Niektóre osoby uważają, że korelacja...

10
Średni czas przeżycia dla logarytmicznej funkcji przeżycia

Znalazłem wiele wzorów pokazujących, jak znaleźć średni czas przeżycia dla rozkładu wykładniczego lub Weibulla, ale mam znacznie mniej szczęścia dla funkcji przeżycia logarytmicznych. Biorąc pod uwagę następującą funkcję przeżycia: S.( t ) = 1 - ϕ [ ln( t ) - μσ]S.(t)=1-ϕ[ln⁡(t)-μσ]S(t) = 1 -...

10
Gigantyczna kurtoza?

Robię opisowe statystyki dziennych zwrotów z indeksów giełdowych. To jeśli i są poziomami indeksu odpowiednio w dniu 1 i dniu 2, to jest zwrotem, którego używam (całkowicie standardowe w literaturze).P 2 l o g e ( P 2P.1P1P_1P.2)P2P_2l o gmi( P2)P.1)loge(P2P1)log_e (\frac{P_2}{P_1}) Więc kurtoza...

10
Czy model P (Y | X) można wytrenować za pomocą stochastycznego spadku gradientu z nie-iidowych próbek P (X) i iidowych próbek P (Y | X)?

Podczas uczenia sparametryzowanego modelu (np. W celu zmaksymalizowania prawdopodobieństwa) za pomocą stochastycznego spadku gradientowego na niektórych zbiorach danych, powszechnie przyjmuje się, że próbki szkoleniowe są pobierane z rozkładu danych szkoleniowych. Jeśli więc celem jest modelowanie...

10
błąd randomForest i zmienna ważność?

Nie dostaję różnicy między rfobject$importancei importance(rfobject)w kolumnie MeanDecreaseAccuracy. Przykład: > data("iris") > fit <- randomForest(Species~., data=iris, importance=TRUE) > fit$importance setosa versicolor virginica MeanDecreaseAccuracy MeanDecreaseGini Sepal.Length...