Statystyki i duże zbiory danych

14
Confounder - definicja

Według M. Katza w jego książce Analiza wieloczynnikowa (sekcja 1.2, strona 6): „ Zdezorientator jest związany z czynnikiem ryzyka i przyczynowo związany z wynikiem. ” Dlaczego ten dezorientator musi być przyczynowo związany z wynikiem? Czy wystarczyłoby, aby osoba wprowadzająca zamieszanie...

14
Standardowy błąd mediany

Czy poniższa formuła jest odpowiednia, jeśli chcę zmierzyć błąd standardowy mediany w przypadku małej próbki o nietypowym rozkładzie (używam pytona)? sigma=np.std(data) n=len(data)

14
Przedział ufności dla różnicy między proporcjami

Zastanawiam się, czy ktoś mógłby mi powiedzieć, czy poprawnie obliczyłem przedział ufności dla różnicy między dwiema proporcjami. Wielkość próby wynosi 34, z czego 19 to kobiety, a 15 to mężczyźni. Dlatego różnica w proporcjach wynosi 0,1176471. Obliczam 95% przedział ufności dla różnicy między...

14
Pakiety imputacji KNN

Szukam pakietu kalkulacyjnego KNN. Patrzyłem na pakiet imputacji ( http://cran.r-project.org/web/packages/imputation/imputation.pdf ), ale z jakiegoś powodu funkcja imputacji KNN (nawet jeśli podąża za przykładem z opisu) wydaje się tylko przypisywać wartości zerowe (jak poniżej). Rozglądałem się,...

14
Losowy las i prognozy

Próbuję zrozumieć, jak działa Losowy Las. Rozumiem, jak buduje się drzewa, ale nie rozumiem, w jaki sposób Losowy Las przewiduje prognozy na podstawie próbki z torby. Czy ktoś mógłby mi podać proste wyjaśnienie?

14
Praktyczny przykład dla MCMC

Przechodziłem wykłady związane z MCMC. Nie znalazłem jednak dobrego przykładu tego, jak się go używa. Czy ktoś może dać mi konkretny przykład. Widzę tylko, że prowadzą łańcuch Markowa i mówią, że jego rozkład stacjonarny jest rozkładem pożądanym. Chcę dobrego przykładu, w którym trudno jest pobrać...