Statystyki i duże zbiory danych

14

Biorę udział w kursie uczenia maszynowego Andrew Nga i po kilku próbach nie byłem w stanie uzyskać poprawnej odpowiedzi na to pytanie. Prosimy o pomoc w rozwiązaniu tego problemu, chociaż przeszedłem poziom. Załóżmy, że uczniów wzięło udział w zajęciach, a klasa miała egzamin śródokresowy i...

machine-learning self-study normalization

14

Sieć neuronowa - wejście binarne vs dyskretne / ciągłe

Czy są jakieś dobre powody, aby preferować wartości binarne (0/1) zamiast dyskretnych lub ciągłych wartości znormalizowanych , np. (1; 3), jako dane wejściowe dla sieci sprzężenia zwrotnego dla wszystkich węzłów wejściowych (z propagacją wsteczną lub bez)? Oczywiście mówię tylko o danych...

neural-networks

14

Jakie są szybkie algorytmy obliczania skróconego SVD?

Ewentualnie od tematu tutaj, ale istnieje kilka ( jeden , dwa ) pytania związane już. Grzebanie w literaturze (lub wyszukiwanie google za pomocą Skróconych algorytmów SVD) ujawnia wiele artykułów, które wykorzystują obcięte SVD na różne sposoby i twierdzą (frustrujące, często bez cytowania), że...

algorithms svd numerics

14

Ścieżka do statystyki matematycznej bez tła analizy: idealny podręcznik do samodzielnej nauki

Jestem dość matematycznie skłonny - miałem 6 semestrów matematyki na studiach licencjackich - chociaż jestem trochę poza praktyką i powolny, powiedzmy, częściowe równania różniczkowe i całki ścieżkowe, moje koncepcje wracają z odrobiną praktyki. Nie miałem kursu na dowodach matematycznych (myślenie...

mathematical-statistics references

14

Trenuj sieć neuronową, aby rozróżniać liczby parzyste od nieparzystych

Pytanie: czy można wytrenować NN, aby rozróżniał liczby nieparzyste od parzystych tylko przy użyciu samych danych wejściowych? Mam następujący zestaw danych: Number Target 1 0 2 1 3 0 4 1 5 0 6 1 ... ... 99 0 100 1 Trenowałem NN z dwoma neuronami wejściowymi (jeden jest zmienną liczbą, drugi...

machine-learning classification categorical-data neural-networks genetic-algorithms

14

Zrozumienie regresji procesu Gaussa poprzez nieskończony wymiarowy widok funkcji bazowej

Często mówi się, że regresja procesu gaussowskiego odpowiada (GPR) bayesowskiej regresji liniowej z (być może) nieskończoną ilością funkcji bazowych. Obecnie staram się to szczegółowo zrozumieć, aby uzyskać intuicję, jakie modele mogę wyrazić za pomocą GPR. Czy uważasz, że to dobre podejście do...

gaussian-process kernel-trick basis-function

14

Wyjście prognozy regresji logistycznej

Utworzyłem regresję logistyczną przy użyciu następującego kodu: full.model.f = lm(Ft_45 ~ ., LOG_D) base.model.f = lm(Ft_45 ~ IP_util_E2pl_m02_flg) step(base.model.f, scope=list(upper=full.model.f, lower=~1), direction="forward", trace=FALSE) Następnie wykorzystałem dane wyjściowe do stworzenia...

r probability logistic

14

Przykład rozkładu gruboogoniastego, który nie jest długi

Na podstawie odczytów o rozkładach ciężkich i długoogonowych zrozumiałem, że wszystkie rozkłady długoogoniaste są gruboogoniaste , ale nie wszystkie rozkłady gruboogoniaste są długoogoniaste . Czy ktoś mógłby podać przykład: ciągła, symetryczna funkcja gęstości o zerowej średniej, która jest...

distributions heavy-tailed

14

Podręczniki / lektury na temat tego, co robić, gdy nie można stworzyć idealnego eksperymentu?

Mój trening statystyczny jest zakorzeniony w statystykach matematycznych, a przyjmowanie tych metod w moim stwardnieniu rozsianym jest w tej chwili trochę szokiem; obecnie trudno mi zrozumieć niektóre z tych „stosowanych” metod, ponieważ brakuje mi doświadczenia w branży. Jednym z tematów, o...

references experiment-design

14

Czy istnieją alternatywy dla Elo dla wydarzeń niezwiązanych z drużyną / indywidualnych?

Czy istnieją znane systemy oceny lub rankingu, podobne do Elo, dla wydarzeń z udziałem wielu uczestników? Na przykład system, który może oceniać różne formy wyścigów (auto, zjazd, jazda itp.) Lub inne indywidualne sporty (na przykład

ranking elo

14

Jak przeprowadzić rozbudowę danych i rozdzielić walidację pociągu?

Dokonuję klasyfikacji obrazów przy użyciu uczenia maszynowego. Załóżmy, że mam pewne dane treningowe (obrazy) i podzielę dane na zestawy szkoleniowe i walidacyjne. Chcę też rozszerzyć dane (tworzyć nowe obrazy z oryginalnych) przez losowe obroty i wstrzykiwanie szumu. Augmentacja odbywa się...

machine-learning classification cross-validation dataset data-augmentation

14

Jak znaleźć tryb funkcji gęstości prawdopodobieństwa?

Zainspirowany moim drugim pytaniem , chciałbym zapytać, w jaki sposób można znaleźć tryb funkcji gęstości prawdopodobieństwa (PDF) funkcji ?fa( x )f(x)f(x) Czy istnieje jakaś procedura „książki kucharskiej”? Najwyraźniej to zadanie jest znacznie trudniejsze, niż się...

pdf function mode shortest-half

14

Jakie jest znaczenie wektorów własnych wzajemnej matrycy informacji?

Patrząc na wektory własne macierzy kowariancji, otrzymujemy kierunki maksymalnej wariancji (pierwszy wektor własny to kierunek, w którym dane najbardziej się różnią itp.); nazywa się to analizą głównych składników (PCA). Zastanawiałem się, co to znaczy spojrzeć na wektory własne / wartości matrycy...

pca entropy mutual-information eigenvalues

14

Jak uzyskać probabilistyczną interpretację AUC?

Dlaczego obszar pod krzywą ROC to prawdopodobieństwo, że klasyfikator uszereguje losowo wybraną „pozytywną” instancję (na podstawie uzyskanych prognoz) wyższą niż przypadkowo wybrana „pozytywna” instancja (z oryginalnej pozytywnej klasy)? W jaki sposób można udowodnić matematycznie to stwierdzenie...

probability roc auc

14

Głębokie sieci neuronowe - tylko do klasyfikacji obrazów?

Wszystkie przykłady, które znalazłem przy użyciu głębokiej wiary lub splotowych sieci neuronowych, wykorzystują je do klasyfikacji obrazu, wykrywania czatu lub rozpoznawania mowy. Czy głębokie sieci neuronowe są również przydatne w przypadku klasycznych zadań regresyjnych, w których cechy nie są...

regression machine-learning neural-networks deep-learning

14

Różnica między średnim a marginalnym efektem leczenia

Czytałem kilka artykułów i nie jestem pewien na temat szczegółowych definicji średniego efektu leczenia (ATE) i marginalnego efektu leczenia (MTE). Czy oni są tacy sami? Według Austina ... Efekt warunkowy to średni efekt na poziomie podmiotu przeniesienia pacjenta z nieleczonego na leczony....

causality hazard propensity-scores marginal-effect marginal-model

14

Wnioskowanie statystyczne przy błędnym określeniu

Klasyczne podejście wnioskowania statystycznego opiera się na założeniu, że istnieje poprawnie określona statystyka. Oznacza to, że rozkład P∗(Y)P∗(Y)\mathbb{P}^*(Y) który wygenerował zaobserwowane dane yyy jest częścią modelu statystycznego

hypothesis-testing confidence-interval model frequentist misspecification

14

Bayesian lasso kontra kolec i płyta

Pytanie: Jakie są zalety / wady korzystania z jednego wcześniejszego do drugiego przy selekcji zmiennych? Załóżmy, że ma prawdopodobieństwo: , w którym można umieścić albo jedną priors:

bayesian feature-selection

14

Czy w GLM prawdopodobieństwo dziennika modelu nasyconego zawsze wynosi zero?

Jako część danych wyjściowych uogólnionego modelu liniowego do oceny modelu wykorzystywane są odchylenie zerowe i rezydualne. Często widzę formuły dla tych wielkości wyrażone jako prawdopodobieństwo dziennika modelu nasyconego, na przykład: /stats//a/113022/22199 , Regresja logistyczna: jak uzyskać...

regression generalized-linear-model deviance log-likelihood

14

Jakie są metody statystyczne polecania filmów takich jak Netflix?

Chcę wdrożyć model dynamiczny, aby polecić film użytkownikowi. Zalecenia należy aktualizować za każdym razem, gdy użytkownik ogląda film lub ocenia go. Dla uproszczenia myślę o wzięciu pod uwagę dwóch czynników: wcześniejsze oceny innych filmów użytkownika czas, w którym użytkownik obejrzał...

machine-learning recommender-system dynamic-regression