Statystyki i duże zbiory danych

11
uzyskiwanie stopni swobody od lmer

Dopasowałem lmer model z następującymi (aczkolwiek wymyślonymi danymi wyjściowymi): Random effects: Groups Name Std.Dev. day:sample (Intercept) 0.09 sample (Intercept) 0.42 Residual 0.023 Naprawdę chciałbym zbudować przedział ufności dla każdego efektu, używając następującej formuły: ( n -...

11
Łańcuchy Markowa vs. HMM

Łańcuchy Markowa mają dla mnie sens, mogę je wykorzystać do modelowania probabilistycznych zmian stanu w rzeczywistych problemach. Potem jest HMM. Mówi się, że HMM są bardziej odpowiednie do modelowania wielu problemów niż MC. Jednak problemy, o których wspominają ludzie, są nieco skomplikowane do...

11
Różnica w środkach a średnia różnica

Badając dwie niezależne próbki, powiedziano nam, że patrzymy na „różnicę dwóch średnich”. Oznacza to, że bierzemy średnią z populacji 1 ( ) i odejmujemy od niej średnią z populacji 2 ( ). Nasza „różnica dwóch średnich” to ( - ).y¯1y¯1\bar y_1y¯2)y¯2)\bar y_2y¯1y¯1\bar y_1y¯2)y¯2)\bar y_2 Badając...

11
Podziel dane na N równych grup

Mam ramkę danych, która zawiera wartości w 4 kolumnach: Na przykład: ID, price, click count,rating Chciałbym „podzielić” tę ramkę danych na N różnych grup, w których każda grupa będzie miała taką samą liczbę wierszy z takim samym rozkładem ceny, liczby kliknięć i atrybutów ocen. Wszelkie...

11
Jak interpretować wycięte wykresy pudełkowe

Wykonując EDA postanowiłem użyć wykresu pudełkowego, aby zilustrować różnicę między dwoma poziomami czynnika. Sposób, w jaki ggplot renderował wykres pudełkowy, był zadowalający, ale nieco uproszczony (pierwszy wykres poniżej). Podczas badania właściwości wykresów pudełkowych zacząłem...

11
Ogólna wartość p i p-wartości parami?

ogólny model liniowy których prawdopodobieństwo dziennika wynosi .y= β0+ β1x1+ β2)x2)+ β3)x3),y=β0+β1x1+β2x2+β3x3,y=\beta_0+\beta_1x_1+\beta_2x_2+\beta_3x_3,L.uLuL_u Teraz chcę sprawdzić, czy współczynniki są takie same. Po pierwsze, ogólny test: prawdopodobieństwo dziennika zredukowanego...

11
Jak symulować dane cenzurowane

Zastanawiam się, jak mogę zasymulować próbkę n okresów życia rozkładu Weibulla, które obejmują obserwacje z cenzurą po prawej stronie typu I. Na przykład niech n = 3, kształt = 3, skala = 1, a szybkość cenzury = 0,15, a czas cenzury = 0,88. Wiem, jak wygenerować próbkę Weibulla, ale nie wiem, jak...