Statystyki i duże zbiory danych

22
Różnice między rozkładem ciężkich i grubych ogonów

Myślałem, że ciężki ogon = gruby ogon, ale niektóre artykuły, które czytałem, dały mi wrażenie, że tak nie jest. Jeden z nich mówi: ciężki ogon oznacza, że ​​rozkład ma nieskończony j-ty moment dla jakiejś liczby całkowitej j. Dodatkowo wszystkie dfs w dziedzinie puli przyciągania Pareto df są...

22
Jak zapewnić właściwości macierzy kowariancji przy dopasowywaniu wielowymiarowego modelu normalnego przy maksymalnym prawdopodobieństwie?

Załóżmy, że mam następujący model yi=f(xi,θ)+εiyi=f(xi,θ)+εiy_i=f(x_i,\theta)+\varepsilon_i where yi∈RKyi∈RKy_i\in \mathbb{R}^K , xixix_i is a vector of explanatory variables, θθ\theta is the parameters of non-linear function fff and εi∼N(0,Σ)εi∼N(0,Σ)\varepsilon_i\sim N(0,\Sigma), where...

22
Na „sile” słabych uczniów

Mam kilka ściśle powiązanych pytań dotyczących słabych uczniów uczących się w zespole (np. Przyspieszenie). Może to zabrzmieć głupio, ale jakie są zalety korzystania ze słabych w porównaniu z silnymi uczniami? (np. dlaczego nie wzmocnić za pomocą „silnych” metod uczenia się?) Czy istnieje jakaś...

22
Korelacja międzyklasowa (ICC) dla interakcji?

Załóżmy, że mam pewien pomiar dla każdego przedmiotu w każdej witrynie. Dwie zmienne, przedmiot i miejsce, są interesujące pod względem obliczania wartości korelacji wewnątrzklasowej (ICC). Zazwyczaj używałbym funkcji lmerz pakietu R lme4i uruchamiał się lmer(measurement ~ 1 + (1 | subject) + (1 |...

22
Obliczanie mocy statystycznej

Jak rozumiem, muszę znać co najmniej trzy aspekty (spośród czterech) mojego proponowanego badania, aby przeprowadzić analizę mocy, a mianowicie: rodzaj testu - Zamierzam użyć Pearsona i ANCOVA / Regresja - GLM poziom istotności (alfa) - Zamierzam użyć 0,05 oczekiwany rozmiar efektu - zamierzam...

22
Jak dopasować zestaw danych do rozkładu Pareto w R?

Mieć, powiedzmy, następujące dane: 8232302 684531 116857 89724 82267 75988 63871 23718 1696 436 439 248 235 Potrzebujesz prostego sposobu dopasowania tego (i kilku innych zestawów danych) do dystrybucji Pareto. Idealnie byłoby wyprowadzić pasujące wartości teoretyczne, mniej idealnie...

22
Jak napisać formułę modelu liniowego ze 100 zmiennymi w języku R

Zablokowana . To pytanie i odpowiedzi są zablokowane, ponieważ pytanie jest nie na temat, ale ma znaczenie historyczne. Obecnie nie akceptuje nowych odpowiedzi ani interakcji. Czy istnieje prosty sposób w R na utworzenie regresji liniowej na modelu ze 100 parametrami w...