Statystyki i duże zbiory danych

9
Dziwny sposób obliczania chi-kwadrat w Excelu vs R.

Patrzę na arkusz programu Excel, który twierdzi, że oblicza χ2)χ2\chi^2, ale nie rozpoznaję tego sposobu i zastanawiałem się, czy coś mi umknęło. Oto dane, które analizuje: +------------------+----------+----------+ | Total Population | Observed | Expected

9
Intuicja na temat wspólnej entropii

Mam problem z budowaniem intuicji na temat wspólnej entropii. H.( X, Y)H(X,Y)H(X,Y) = niepewność w łącznym rozkładzie p ( x , y)p(x,y)p(x,y); H.( X)H(X)H(X) = niepewność w px( x )px(x)p_x(x); H.( Y)H(Y)H(Y) = niepewność w py( y)py(y)p_y(y). Jeśli H (X) jest wysoki, rozkład jest bardziej...

9
R wykrywa wzrost / spadek trendu szeregów czasowych

Mam wiele szeregów czasowych z okresami: dzień, tydzień lub miesiąc. Z stl()funkcją lub z loess(x ~ y)widzę, jak wyglądają trendy poszczególnych szeregów czasowych. Muszę wykryć, czy trend szeregów czasowych rośnie, czy maleje. Jak sobie z tym poradzić? Próbowałem obliczyć współczynniki regresji...

9
Wartość odcięcia odległości Cooka

Czytałem o odległości kucharza, aby zidentyfikować wartości odstające, które mają duży wpływ na moją regresję. W oryginalnym badaniu Cooka powiedział, że wskaźnik odcięcia 1 powinien być porównywalny do zidentyfikowania czynników wpływających. Wykorzystują jednak różne inne badania4n4n\frac{4}{n}...

9
Równoważność wartości AIC i pw wyborze modelu

W komentarzu do odpowiedzi na to pytanie stwierdzono, że zastosowanie AIC w wyborze modelu było równoważne z zastosowaniem wartości p 0,154. Próbowałem w R, gdzie użyłem algorytmu wyboru podzbioru „wstecznego”, aby wyrzucić zmienne z pełnej specyfikacji. Po pierwsze, sekwencyjnie wyrzucając...