Statystyki i duże zbiory danych

41
Jak obliczyć

Załóżmy, że ϕ(⋅)ϕ(⋅)\phi(\cdot) i Φ(⋅)Φ(⋅)\Phi(\cdot) są funkcją gęstości i funkcją rozkładu standardowego rozkładu normalnego. Jak obliczyć całkę: ∫∞−∞Φ(w−ab)ϕ(w)dw∫−∞∞Φ(w−ab)ϕ(w)dw\int^{\infty}_{-\infty}\Phi\left(\frac{w-a}{b}\right)\phi(w)\,\mathrm...

41
Losowy las - jak radzić sobie z przeuczeniem

Mam wykształcenie informatyczne, ale staram się uczyć danych, rozwiązując problemy w Internecie. Pracowałem nad tym problemem przez ostatnie kilka tygodni (około 900 wierszy i 10 funkcji). Początkowo korzystałem z regresji logistycznej, ale teraz przerzuciłem się na losowe lasy. Kiedy uruchamiam...

41
Jak interpretować miary błędów?

Korzystam z klasyfikowania w Weka dla określonego zestawu danych i zauważyłem, że jeśli próbuję przewidzieć wartość nominalną, dane wyjściowe wyraźnie pokazują prawidłowe i niepoprawne wartości. Jednak teraz uruchamiam go dla atrybutu liczbowego, a wynikiem jest: Correlation coefficient...

40
Problem Monty Hall - gdzie zawodzi nasza intuicja?

Z Wikipedii: Załóżmy, że bierzesz udział w teleturnieju i masz do wyboru trzy drzwi: za jednymi drzwiami jest samochód; za innymi kozy. Ty wybierasz drzwi, powiedz nr 1, a gospodarz, który wie, co jest za drzwiami, otwiera kolejne drzwi, powiedz nr 3, który ma kozę. Następnie mówi do ciebie:...

40
Regresja logistyczna w R (iloraz szans)

Próbuję przeprowadzić analizę regresji logistycznej w R. Brałem udział w kursach obejmujących ten materiał przy użyciu STATA. Bardzo trudno jest mi powielić funkcjonalność R. Czy w tym obszarze jest dojrzały? Wydaje się, że dostępna jest niewielka dokumentacja lub wytyczne. Wydawanie wyników...

40
Jak interpretować wartość F i p w ANOVA?

Jestem nowy w statystyce i obecnie zajmuję się ANOVA. Przeprowadzam test ANOVA w R. używając aov(dependendVar ~ IndependendVar) Dostaję - między innymi - wartość F i wartość p. Moja hipoteza ( ) jest taka, że ​​wszystkie średnie grupowe są równe.H.0H.0H_0 Dostępnych jest wiele informacji na...