Statystyki i duże zbiory danych

9
Trzy otwarte problemy filozoficzne w statystyce

Niedawno skończyłem czytać The Lady Tasting Tea , zabawną książkę o historii statystyki. Na końcu książki autor David Salsburg proponuje trzy otwarte problemy filozoficzne w statystyce, a rozwiązania, które jego zdaniem miałyby większe implikacje dla zastosowania teorii statystycznej w nauce. Nigdy...

9
Ocena mocy testu normalności (w R)

Chcę ocenić dokładność testów normalności dla różnych wielkości próbek w R (zdaję sobie sprawę, że testy normalności mogą być mylące ). Na przykład, aby spojrzeć na test Shapiro-Wilka, przeprowadzam następującą symulację (a także sporządzam wyniki) i oczekuję, że wraz ze wzrostem wielkości próby...

9
Lasso porządkuje opóźnienie?

Załóżmy, że mam dane podłużne postaci (Mam wiele obserwacji, to tylko forma jednego). Interesują mnie ograniczenia dotyczące . Nieograniczony jest równoważny z wzięciem z .Y =(Y1, ... ,Yjot) ∼ N( μ , Σ )Y=(Y1,…,YJ)∼N(μ,Σ)\mathbf Y = (Y_1, \ldots, Y_J) \sim \mathcal N(\mu,...

9
R: Anova i regresja liniowa

Jestem nowy w statystyce i staram się zrozumieć różnicę między ANOVA a regresją liniową. Używam R. do zbadania tego. Czytałem różne artykuły o tym, dlaczego ANOVA i regresja są różne, ale wciąż takie same, i jak można to wizualizować itp. Myślę, że jestem tam dość, ale wciąż brakuje jednego...

9
Oczekiwanie na sumę liczb K bez wymiany

Biorąc pod uwagę liczb, gdzie wartość każdej liczby jest inna, oznaczona jako , a prawdopodobieństwo wyboru każdej liczby wynosi odpowiednio .nnnv1,v2,...,vnv1,v2,...,vnv_1, v_2, ..., v_np1,p2,...,pnp1,p2,...,pnp_1, p_2, ..., p_n Teraz, jeśli liczby na podstawie podanych prawdopodobieństw, gdzie ,...