Statystyki i duże zbiory danych

21

Biorąc pod uwagę wystarczająco dużą wielkość próby, test zawsze pokaże znaczący wynik, chyba że rzeczywisty rozmiar efektu wynosi dokładnie zero. Czemu?

Jestem ciekawy twierdzenia zawartego w artykule Wikipedii dotyczącym wielkości efektu . Konkretnie: [...] porównanie statystyczne o wartości innej niż zero zawsze będzie wykazywać statystycznie znaczące wyniki, chyba że wielkość efektu populacji będzie dokładnie równa zero Nie jestem pewien,...

hypothesis-testing

21

Strata treningowa rośnie z czasem [duplikat]

To pytanie ma już odpowiedzi tutaj : Jak zmiana funkcji kosztów może być dodatnia? (1 odpowiedź) Co powinienem zrobić, gdy moja sieć neuronowa się nie uczy? (5 odpowiedzi) Zamknięte w zeszłym miesiącu . Trenuję model (Recurrent Neural Network) do...

machine-learning neural-networks loss-functions rnn training-error

21

Granica estymacji regresji grzbietu „wariancji jednostkowej”, gdy

Rozważ regresję kalenicową z dodatkowym ograniczeniem wymagającym, aby miał jednostkową sumę kwadratów (równoważnie wariancję jednostkową); w razie potrzeby można założyć, że ma również jednostkową sumę kwadratów:y^y^\hat{\mathbf y}yy\mathbf

pca regularization ridge-regression partial-least-squares constrained-regression

21

Skąd nazwa „jądro” w statystykach i ML?

Zostało to zadane na innych stronach SE w kontekście systemów operacyjnych i algebry liniowej, ale to samo pytanie mnie martwi w odniesieniu do metod jądra używanych w statystyce i uczeniu maszynowym. Często mówi się, że jądra, np. W szacowaniu gęstości jądra lub SVM, reprezentują pewne...

terminology

21

Czy istnieje jakaś różnica między częstym a bayesowskim w definicji prawdopodobieństwa?

Niektóre źródła podają, że funkcja prawdopodobieństwa nie jest prawdopodobieństwem warunkowym, niektóre twierdzą, że tak. To jest dla mnie bardzo mylące. Według większości źródeł, które widziałem, prawdopodobieństwo rozkładu z parametrem powinno być iloczynem funkcji masy prawdopodobieństwa,...

probability bayesian conditional-probability likelihood frequentist

21

Dlaczego nazwy typu Błąd 1, 2?

Jaka jest motywacja do wprowadzenia dodatkowego poziomu pośredniczości od opisowego „fałszywie dodatniego” do liczby całkowitej „1”? Czy „fałszywie pozytywne” jest naprawdę zbyt

terminology frequentist type-i-and-ii-errors

21

Czym dokładnie jest ziarno w generatorze liczb losowych?

Próbowałem użyć zwykłego wyszukiwania w Google itp., Ale większość odpowiedzi, które znalazłem, są albo niejasne, albo specyficzne dla języka / biblioteki, takie jak Python lub C ++ stdlib.hitp. Szukam agnostycznej, matematycznej odpowiedzi na język, a nie specyfiki biblioteki. Na przykład wielu...

random-generation

21

Dlaczego centralne twierdzenie graniczne załamuje się w mojej symulacji?

Powiedzmy, że mam następujące liczby: 4,3,5,6,5,3,4,2,5,4,3,6,5 Próbkuję niektóre z nich, powiedzmy 5 z nich, i obliczam sumę 5 próbek. Następnie powtarzam to w kółko, aby uzyskać wiele sum, i wykreślam wartości sum w histogramie, który będzie gaussowski z powodu twierdzenia o granicy...

central-limit-theorem

20

Zawsze zgłaszaj solidne (białe) błędy standardowe?

Angrist i Pischke zasugerowali, że Odporne (tj. Odporne na heteroskedastyczność lub nierówne wariancje) Błędy standardowe są zgłaszane jako rzecz oczywista, a nie testowanie. Dwa pytania: Jaki jest wpływ na standardowe błędy popełniane w przypadku homoskedastyczności? Czy ktoś faktycznie robi to...

regression standard-error heteroscedasticity robust-standard-error

20

W jaki sposób losowy las generuje losowy las

Nie jestem ekspertem od losowego lasu, ale doskonale rozumiem, że kluczowym problemem z losowym lasem jest (losowe) generowanie drzew. Czy możesz mi wyjaśnić, w jaki sposób generowane są drzewa? (tj. Jaka jest używana dystrybucja do generowania drzew?) Z góry dziękuję !...

machine-learning r algorithms cart random-forest

20

Kiedy można użyć kryteriów opartych na danych, aby określić model regresji?

Słyszałem, że gdy wiele specyfikacji modelu regresji (powiedzmy w OLS) jest rozważanych jako możliwości zestawu danych, powoduje to wiele problemów z porównaniem, a wartości p i przedziały ufności nie są już wiarygodne. Jednym z ekstremalnych przykładów jest regresja stopniowa. Kiedy mogę użyć...

regression frequentist multiple-comparisons

20

Post-hocs dla testów przedmiotowych?

Jaka jest preferowana metoda przeprowadzania post-hoców w ramach testów przedmiotowych? Widziałem opublikowane prace, w których stosuje się HSD Tukeya, ale przegląd Keppela i Maxwella i Delaneya sugeruje, że prawdopodobne naruszenie kulistości w tych projektach powoduje, że termin błędu jest...

r repeated-measures multiple-comparisons post-hoc sphericity

20

Jakie są prawidłowe wartości precyzji i przywołania w przypadkach krawędzi?

Precyzja jest zdefiniowana jako: p = true positives / (true positives + false positives) Czy jest to prawidłowe, że, jak true positivesi false positivespodejście 0, precyzja zbliża 1? To samo pytanie do przypomnienia: r = true positives / (true positives + false negatives) Obecnie wdrażam...

precision-recall data-visualization logarithm references r networks data-visualization standard-deviation probability binomial negative-binomial r categorical-data aggregation plyr survival python regression r t-test bayesian logistic data-transformation confidence-interval t-test interpretation distributions data-visualization pca genetics r finance maximum probability standard-deviation probability r information-theory references computational-statistics computing references engineering-statistics t-test hypothesis-testing independence definition r censoring negative-binomial poisson-distribution variance mixed-model correlation intraclass-correlation aggregation interpretation effect-size hypothesis-testing goodness-of-fit normality-assumption small-sample distributions regression normality-assumption t-test anova confidence-interval z-statistic finance hypothesis-testing mean model-selection information-geometry bayesian frequentist terminology type-i-and-ii-errors cross-validation smoothing splines data-transformation normality-assumption variance-stabilizing r spss stata python correlation logistic logit link-function regression predictor pca factor-analysis r bayesian maximum-likelihood mcmc conditional-probability statistical-significance chi-squared proportion estimation error shrinkage application steins-phenomenon

20

Czy mój meteorolog jest dokładny?

Pytanie, które martwiło mnie przez jakiś czas, na które nie wiem jak odpowiedzieć: Każdego dnia mój meteorolog daje procentową szansę na deszcz (załóżmy, że obliczono go na 9000 cyfr i nigdy nie powtórzył żadnej liczby). Każdego dnia pada albo nie pada. Mam lata danych - procent szans względem...

hypothesis-testing forecasting

20

Stosujesz „sztuczkę jądra” do metod liniowych?

Trik jądro jest stosowana w kilku modelach uczenia maszynowego (np SVM ). Po raz pierwszy został wprowadzony w artykule „Teoretyczne podstawy metody funkcji potencjalnej w uczeniu się rozpoznawania wzorców” w 1964 r. Definicja wikipedia mówi, że tak sposób zastosowania algorytmu klasyfikatora...

machine-learning kernel-trick

20

Algorytmy Metropolis-Hastings stosowane w praktyce

Czytałem dziś blog Christiana Roberta i całkiem podobał mi się nowy algorytm Metropolis-Hastings, o którym rozmawiał. Wydawało się proste i łatwe do wdrożenia. Ilekroć koduję MCMC, mam tendencję do trzymania się bardzo podstawowych algorytmów MH, takich jak niezależne ruchy lub losowe spacery na...

mcmc metropolis-hastings

20

Jak połączyć przedziały ufności dla komponentu wariancji modelu z efektami mieszanymi, gdy używana jest wielokrotna imputacja

Logiką wielokrotnej imputacji (MI) jest przypisywanie brakujących wartości nie jeden raz, ale kilka razy (zwykle M = 5) razy, co skutkuje M zakończonymi zestawami danych. M zakończonych zestawów danych jest następnie analizowanych metodami kompletnych danych, na podstawie których szacunki M i ich...

modeling confidence-interval mixed-model data-imputation

20

Dobry zasób, aby zrozumieć ANOVA i ANCOVA?

Prowadzę eksperymenty na papierze i szukam interesującej książki / strony internetowej, aby właściwie zrozumieć, jak działają ANOVA i ANCOVA. Mam dobre doświadczenie matematyczne, więc niekoniecznie potrzebuję wulgarnych wyjaśnień. Chciałbym również wiedzieć, jak ustalić, kiedy użyć ANOVA zamiast...

anova references ancova

20

Chwile rozkładu - jakikolwiek użytek na momenty częściowe lub wyższe?

Zwykle używa się drugiego, trzeciego i czwartego momentu rozkładu, aby opisać niektóre właściwości. Czy momenty cząstkowe lub momenty wyższe niż czwarty opisują jakieś użyteczne właściwości

distributions moments partial-moments

20

Dostosowanie do zmiennych towarzyszących w analizie krzywej ROC

To pytanie dotyczy oceny wyników granicznych w wielowymiarowym kwestionariuszu przesiewowym w celu przewidzenia binarnego punktu końcowego w obecności skorelowanych skal. Zapytano mnie o zainteresowanie kontrolowaniem powiązanych wyników przy opracowywaniu punktów odcięcia dla każdego wymiaru...

epidemiology roc