Statystyki i duże zbiory danych

14
Dlaczego

Uwaga: = suma kwadratów ogółem, = suma kwadratów błędów, a = regresja suma kwadratów. Równanie w tytule jest często zapisywane jako:SSTSSTSSTSSESSESSESSRSSRSSR ∑i=1n(yi−y¯)2=∑i=1n(yi−y^i)2+∑i=1n(y^i−y¯)2∑i=1n(yi−y¯)2=∑i=1n(yi−y^i)2+∑i=1n(y^i−y¯)2\sum_{i=1}^n (y_i-\bar y)^2=\sum_{i=1}^n (y_i-\hat...

14
znaczenie (x) operatora?

Wszędzie widziałem operatora w jakimś przeglądzie literatury na temat przyczynowości (patrz, na przykład, ten wpis na Wikipedii ). Nie mogę jednak znaleźć formalnej i ogólnej definicji tego operatora.do(x)do(x)do(x) Czy ktoś może wskazać mi dobre odniesienie w tej sprawie? Interesuje mnie ogólna...

14
Hamiltonian Monte Carlo

Czy ktoś może wyjaśnić główną ideę metod Hamiltona Monte Carlo iw jakich przypadkach przyniesie lepsze wyniki niż metody Monte Carlo Markowa w

14
Prosta regresja liniowa, wartości p i AIC

Zdaję sobie sprawę, że ten temat pojawiał się wiele razy wcześniej, np. Tutaj , ale wciąż nie jestem pewien, jak najlepiej zinterpretować moje wyniki regresji. Mam bardzo prosty zestaw danych, składający się z kolumny wartości x i kolumny wartości y , podzielonych na dwie grupy według lokalizacji...

14
Na przykład korelacja ważona?

Mam kilka interesujących danych na temat najpopularniejszych artystów muzycznych przesyłanych strumieniowo, podzielonych według lokalizacji na około 200 dzielnic kongresowych. Chcę sprawdzić, czy można sondować osobę o jej preferencjach muzycznych i ustalić, czy ona „słucha jak demokrata” czy...