Statystyki i duże zbiory danych

16

Jakie są alternatywy dla wymiaru VC do pomiaru złożoności sieci neuronowych?

Natknąłem się na kilka podstawowych sposobów pomiaru złożoności sieci neuronowych: Naiwne i nieformalne: policz liczbę neuronów, ukrytych neuronów, warstw lub ukrytych warstw Wymiar VC (Eduardo D. Sontag [1998] „Wymiar VC sieci neuronowych” [ pdf ].) Miara złożonejT.do0reT.dore0TC^0_d i...

16

Użycie R i plm do oszacowania modeli efektów stałych, które obejmują interakcje z czasem

Używam plm()do oszacowania modeli formy z efektami stałymi y ~ x + time + time:fixed_trait gdzie fixed_traitjest zmienną, która różni się u poszczególnych osób, ale jest stała w obrębie poszczególnych osób. Punkt interakcji timeze fixed_traitjest umożliwienie efekt fixed_traitzmieniać w czasie....

r

16

Czy w ogóle uzasadnione jest rozwarstwienie zbioru danych według wielkości pozostałości i wykonanie porównania dwóch prób?

Uważam, że jest to metoda ad hoc i wydaje mi się bardzo podejrzana, ale być może czegoś mi brakuje. Widziałem to w regresji wielokrotnej, ale bądźmy prostymi: yi=β0+β1xi+εiyi=β0+β1xi+εi y_{i} = \beta_{0} + \beta_{1} x_{i} + \varepsilon_{i} Teraz weź pozostałości z dopasowanego modelu...

regression residuals

16

Najmniej głupi sposób na prognozowanie krótkich wielowymiarowych szeregów czasowych

Muszę prognozować następujące 4 zmienne dla 29. jednostki czasu. Mam dane historyczne o wartości około 2 lat, gdzie 1, 14 i 27 to ten sam okres (lub pora roku). Na koniec dokonuję dekompozycji w stylu Oaxaca-Blindera na , , i p .w d w c pW.W.Ww dwrewdw cwdowcppp time W wd wc p 1 4.920725 4.684342...

time-series forecasting multivariate-analysis var

16

Znalezienie MLE dla jednoznacznego wykładniczego procesu Hawkesa

Jednowymiarowy wykładniczy proces Hawkesa jest samo-ekscytującym procesem punktowym, którego wskaźnik przybywania zdarzeń wynosi: λ(t)=μ+∑ti<tαe−β(t−ti)λ(t)=μ+∑ti<tαe−β(t−ti) \lambda(t) = \mu +

maximum-likelihood stochastic-processes likelihood

16

Interpretacja wyników testu przyczynowego Grangera

Staram się kształcić na temat przyczynowości Granger. Przeczytałem posty na tej stronie i kilka dobrych artykułów online. Natknąłem się również na bardzo pomocne narzędzie, Bivariate Granger Causality - darmowy kalkulator statystyczny , który umożliwia wprowadzanie szeregów czasowych i obliczanie...

time-series causality granger-causality

16

Obliczanie nowego odchylenia standardowego przy użyciu starego odchylenia standardowego po zmianie zestawu danych

Mam tablicę nnn wartości rzeczywistych, co ma średnią μo l dμolre\mu_{old} i odchylenie standardowe σo l dσolre\sigma_{old} . Jeśli element tablicy xjaxjax_i zostanie zastąpiony innym elementem , wówczas nowa średnia będziexjotxjotx_j μn e

standard-deviation online

16

Jaka dystrybucja jest najczęściej używana do modelowania czasu odpowiedzi serwera?

Mam aplikację opartą na serwletach, w której mierzę czas potrzebny na ukończenie każdego żądania do tego serwletu. Już obliczam proste statystyki, takie jak średnia i maksimum; Chciałbym jednak opracować bardziej wyrafinowaną analizę i do tego celu uważam, że muszę odpowiednio modelować czasy...

distributions web

16

Obliczanie błędu standardowego w oszacowaniu średniej ważonej

Załóżmy, że w1,w2,…,wnw1,w2,…,wnw_1,w_2,\ldots,w_n i x1,x2,...,xnx1,x2,...,xnx_1,x_2,...,x_n są każdy narysowany IID go w dystrybucji z niezależnie od . W są absolutnie pozytywne. Obserwujesz wszystkie , ale nie ; raczej obserwujesz . Jestem zainteresowany oszacowaniem...

standard-error weighted-mean

16

Jak wyjaśniłbyś uogólnione modele liniowe osobom bez tła statystycznego?

Zawsze trudno mi wyjaśnić odbiorcom techniki statystyczne bez tła statystycznego. Gdybym chciał wyjaśnić, czym jest GLM dla takich odbiorców (bez rzucania statystycznego żargonu), jaki byłby najlepszy lub najskuteczniejszy sposób? Zazwyczaj tłumaczę GLM trzema częściami - (1) składową losową,...

generalized-linear-model communication

16

Czyścić dane o niespójnym formacie w R?

Często mam do czynienia z niechlujnymi danymi ankiet, które wymagają dużo czyszczenia, zanim będzie można wykonać statystyki. Robiłem to „ręcznie” w programie Excel, czasami używając formuł Excela, a czasem sprawdzając wpisy jeden po drugim. Zacząłem robić coraz więcej tych zadań, pisząc skrypty do...

r data-cleaning

16

Czy dostępna jest ogólna metoda symulowania danych ze wzoru lub analizy?

De novo symulacja danych z eksperymentalnej ramki danych projektowych. Z naciskiem na R (choć inne rozwiązanie językowe byłoby świetne). Podczas projektowania eksperymentu lub ankiety symulowanie danych i przeprowadzanie analizy tych symulowanych danych może zapewnić świetny wgląd w zalety i wady...

r experiment-design simulation

16

Jak uruchomić dwukierunkową ANOVA na danych bez normalności ani równości wariancji w R?

Obecnie pracuję nad moją pracą magisterską i planuję prowadzić statystyki w SigmaPlot. Jednak po spędzeniu trochę czasu z moimi danymi doszedłem do wniosku, że SigmaPlot może nie nadawać się do mojego problemu (mogę się mylić), więc zacząłem pierwsze próby w R, co nie bardzo ułatwiło. Plan polegał...

r anova nonparametric heteroscedasticity

16

Test na pobieranie próbek IID

Jak byś przetestował lub sprawdził, czy próbkowanie jest IID (niezależne i identycznie rozproszone)? Zauważ, że nie mam na myśli Gaussa i dystrybucji identycznej, tylko IID. Pomysł, który przychodzi mi na myśl, to wielokrotne dzielenie próbki na dwie podpróbki o równej wielkości, wykonanie testu...

hypothesis-testing independence kolmogorov-smirnov resampling iid

16

Czy MLE wymaga danych ID? Czy tylko niezależne parametry?

Oszacowanie parametrów przy użyciu oszacowania maksymalnego prawdopodobieństwa (MLE) obejmuje ocenę funkcji wiarygodności, która odwzorowuje prawdopodobieństwo wystąpienia próbki (X) na wartości (x) w przestrzeni parametrów (θ) dla danej rodziny rozkładów (P (X = x | θ) ) ponad możliwymi...

maximum-likelihood

16

Zmienne współliniowe w szkoleniu Multlass LDA

Trenuję wieloklasowy klasyfikator LDA z 8 klasami danych. Podczas treningu otrzymuję ostrzeżenie: „ Zmienne są współliniowe ” Dostaję dokładność szkolenia ponad 90% . Korzystam z biblioteki scikits-learn w Pythonie do trenowania i testowania danych Multi-class. Dostaję też przyzwoitą dokładność...

machine-learning classification python scikit-learn discriminant-analysis

16

Jaki wpływ ma zwiększenie danych treningowych na ogólną dokładność systemu?

Czy ktoś może podsumować dla mnie możliwe przykłady, w jakich sytuacjach zwiększenie danych treningowych poprawia cały system? Kiedy wykrywamy, że dodanie większej ilości danych treningowych może nadmiernie dopasować dane i nie dać dokładności danych testowych? To bardzo niespecyficzne pytanie,...

machine-learning classification dataset precision-recall

16

Proces Gaussa: właściwości aproksymacji funkcji

Uczę się o procesie Gaussa i słyszałem tylko fragmenty. Byłbym wdzięczny za komentarze i odpowiedzi. Czy w przypadku dowolnego zestawu danych prawdą jest, że aproksymacja funkcji procesu Gaussa dałaby zero lub pomijalny błąd dopasowania w punktach danych? W innym miejscu słyszałem również, że...

gaussian-process

16

Auto.arima vs autobox różnią się?

Po przeczytaniu postów na tej stronie wiem, że jest funkcja R auto.arima(w forecast pakiecie ). Wiem również, że IrishStat , członek tej witryny, zbudował pakiet komercyjny autobox na początku lat 80. Ponieważ te dwa pakiety istnieją dzisiaj i automatycznie wybierają modele arima dla danych...

time-series arima automatic-algorithms

16

Co to jest struktura R struktura G w glmm?

MCMCglmmOstatnio korzystam z pakietu. Jestem zdezorientowany tym, co w dokumentacji nazywane jest strukturą R i strukturą G. Wydaje się, że odnoszą się one do efektów losowych - w szczególności określają parametry wcześniejszego rozkładu na nich, ale dyskusja w dokumentacji wydaje się zakładać, że...

r bayesian mixed-model lme4-nlme