Statystyki i duże zbiory danych

16
Czyścić dane o niespójnym formacie w R?

Często mam do czynienia z niechlujnymi danymi ankiet, które wymagają dużo czyszczenia, zanim będzie można wykonać statystyki. Robiłem to „ręcznie” w programie Excel, czasami używając formuł Excela, a czasem sprawdzając wpisy jeden po drugim. Zacząłem robić coraz więcej tych zadań, pisząc skrypty do...

16
Czy MLE wymaga danych ID? Czy tylko niezależne parametry?

Oszacowanie parametrów przy użyciu oszacowania maksymalnego prawdopodobieństwa (MLE) obejmuje ocenę funkcji wiarygodności, która odwzorowuje prawdopodobieństwo wystąpienia próbki (X) na wartości (x) w przestrzeni parametrów (θ) dla danej rodziny rozkładów (P (X = x | θ) ) ponad możliwymi...

16
Proces Gaussa: właściwości aproksymacji funkcji

Uczę się o procesie Gaussa i słyszałem tylko fragmenty. Byłbym wdzięczny za komentarze i odpowiedzi. Czy w przypadku dowolnego zestawu danych prawdą jest, że aproksymacja funkcji procesu Gaussa dałaby zero lub pomijalny błąd dopasowania w punktach danych? W innym miejscu słyszałem również, że...

16
Auto.arima vs autobox różnią się?

Po przeczytaniu postów na tej stronie wiem, że jest funkcja R auto.arima(w forecast pakiecie ). Wiem również, że IrishStat , członek tej witryny, zbudował pakiet komercyjny autobox na początku lat 80. Ponieważ te dwa pakiety istnieją dzisiaj i automatycznie wybierają modele arima dla danych...

16
Co to jest struktura R struktura G w glmm?

MCMCglmmOstatnio korzystam z pakietu. Jestem zdezorientowany tym, co w dokumentacji nazywane jest strukturą R i strukturą G. Wydaje się, że odnoszą się one do efektów losowych - w szczególności określają parametry wcześniejszego rozkładu na nich, ale dyskusja w dokumentacji wydaje się zakładać, że...