Statystyki i duże zbiory danych

35

Dlaczego często hipotezę zerową często próbuje się odrzucić?

Mam nadzieję, że tytuł ma sens. Często hipoteza zerowa powstaje z zamiarem jej odrzucenia. Czy jest tego powód, czy to tylko

hypothesis-testing

35

W jaki sposób LSTM zapobiega problemowi zanikania gradientu?

LSTM został opracowany specjalnie w celu uniknięcia problemu zanikania gradientu. Ma to zrobić za pomocą karuzeli Constant Error (CEC), która na poniższym schemacie ( Greff i in. ) Odpowiada pętli wokół komórki . (źródło: deeplearning4j.org ) Rozumiem, że ta część może być postrzegana jako...

neural-networks lstm

35

Zwiększanie gradientu dla regresji liniowej - dlaczego to nie działa?

Ucząc się o zwiększaniu gradientu, nie słyszałem o żadnych ograniczeniach dotyczących właściwości „słabego klasyfikatora”, którego ta metoda używa do budowania i składania modelu. Jednak nie wyobrażam sobie zastosowania GB, który wykorzystuje regresję liniową, a właściwie po przeprowadzeniu...

regression machine-learning boosting ensemble gradient

35

Przybliżone za pomocą symulacji Monte Carlo

Ostatnio przyglądałem się symulacji Monte Carlo i używałem jej do przybliżania stałych, takich jak (okrąg wewnątrz prostokąta, obszar proporcjonalny).ππ\pi Nie jestem jednak w stanie wymyślić odpowiedniej metody aproksymacji wartości eee [liczby Eulera] przy użyciu integracji Monte Carlo. Czy...

simulation monte-carlo algorithms random-generation numerical-integration

35

Jak wybrać metodę grupowania? Jak sprawdzić poprawność rozwiązania klastrowego (aby uzasadnić wybór metody)?

Jednym z największych problemów związanych z analizą skupień jest to, że może się zdarzyć, że będziemy musieli wyciągnąć odmienne wnioski, gdy oprą się na różnych zastosowanych metodach klastrowania (w tym różnych metodach łączenia w hierarchicznym klastrze). Chciałbym poznać Twoją opinię na ten...

clustering validation model-evaluation hierarchical-clustering

35

Myśl jak bayesian, sprawdź jak częsty: co to znaczy?

Patrzę na niektóre slajdy wykładowe na kursie danych, który można znaleźć tutaj: https://github.com/cs109/2015/blob/master/Lectures/01-Introduction.pdf Niestety nie widzę wideo z tego wykładu iw pewnym momencie na slajdzie prezenter ma następujący tekst: Niektóre kluczowe zasady Myśl jak...

bayesian data-mining frequentist

35

Dlaczego generowanie 8 losowych bitów jest jednolite na (0, 255)?

Generuję 8 losowych bitów (0 lub 1) i łączę je ze sobą, tworząc liczbę 8-bitową. Prosta symulacja Pythona daje równomierny rozkład w zestawie dyskretnym [0, 255]. Próbuję uzasadnić, dlaczego to ma sens w mojej głowie. Jeśli porównam to do rzucenia 8 monetami, czy oczekiwana wartość nie wyniesie...

binomial random-generation uniform

35

Liniowość PCA

PCA jest uważana za procedurę liniową, jednak: PCA(X)≠PCA(X1)+PCA(X2)+…+PCA(Xn),PCA(X)≠PCA(X1)+PCA(X2)+…+PCA(Xn),\mathrm{PCA}(X)\neq \mathrm{PCA}(X_1)+\mathrm{PCA}(X_2)+\ldots+\mathrm{PCA}(X_n), gdzie . To znaczy, że wektory własne uzyskane przez PCA na macierzach danych nie sumują się do...

pca linear

35

Dowody na istnienie wywołanego przez człowieka globalnego ocieplenia uderzają w „złoty standard”: jak to zrobili?

Ta wiadomość w artykule Reutera z 25.02.2019 jest obecnie w wiadomościach: Dowody na istnienie wywołanego przez człowieka globalnego ocieplenia uderzają w „złoty standard” [Naukowcy] stwierdzili, że pewność, że działalność człowieka podnosi ciepło na powierzchni Ziemi, osiągnęła poziom...

p-value intuition application communication climate

34

Jaka jest słaba strona drzew decyzyjnych?

Drzewa decyzyjne wydają się być bardzo zrozumiałą metodą uczenia maszynowego. Raz utworzony może być łatwo sprawdzony przez człowieka, co jest wielką zaletą w niektórych aplikacjach. Jakie są praktyczne słabe strony drzew

machine-learning nonparametric cart

34

Jaki jest związek między modelami hierarchicznymi, sieciami neuronowymi, modelami graficznymi, sieciami bayesowskimi?

Wszystkie wydają się reprezentować zmienne losowe przez węzły i (nie) zależność poprzez (ewentualnie skierowane) krawędzie. Szczególnie interesuje mnie punkt widzenia

causality neural-networks multilevel-analysis graphical-model

34

Dlaczego istnieje różnica pomiędzy ręcznym obliczeniem regresji logistycznej 95% przedziału ufności a użyciem funkcji confint () w R?

Drodzy wszyscy - zauważyłem coś dziwnego, czego nie potrafię wyjaśnić, prawda? Podsumowując: ręczne podejście do obliczania przedziału ufności w modelu regresji logistycznej oraz funkcja R confint()dają różne wyniki. Przechodziłem przez regresję logistyczną stosowaną przez Hosmer & Lemeshow...

r regression logistic confidence-interval profile-likelihood correlation mcmc error mixture measurement data-augmentation r logistic goodness-of-fit r time-series exponential descriptive-statistics average expected-value data-visualization anova teaching hypothesis-testing multivariate-analysis r r mixed-model clustering categorical-data unsupervised-learning r logistic anova binomial estimation variance expected-value r r anova mixed-model multiple-comparisons repeated-measures project-management r poisson-distribution control-chart project-management regression residuals r distributions data-visualization r unbiased-estimator kurtosis expected-value regression spss meta-analysis r censoring regression classification data-mining mixture

34

W jaki sposób walidacja krzyżowa rozwiązuje problem nadmiernego dopasowania?

Dlaczego procedura walidacji krzyżowej rozwiązuje problem nadmiernego dopasowania

regression model-selection cross-validation

34

Znajdź oczekiwaną wartość za pomocą CDF

Zacznę od stwierdzenia, że jest to zadanie domowe od samego początku. Spędziłem kilka godzin, szukając sposobu na znalezienie oczekiwanych wartości i zdecydowałem, że nic nie rozumiem. Niech XXX ma CDF F(x)=1−x−α,x≥1F(x)=1−x−α,x≥1F(x) = 1 - x^{-\alpha}, x\ge1 . Znajdź E(X)E(X)E(X) dla tych...

self-study expected-value

34

Eksploracja danych: jak powinienem znaleźć formę funkcjonalną?

Jestem ciekaw powtarzalnych procedur, które mogą być wykorzystane do odkrywania postaci funkcyjnej funkcji y = f(A, B, C) + error_term, gdzie jest mój tylko wejście jest zbiorem obserwacji ( y, A, Bi C). Należy pamiętać, że funkcjonalna forma fjest nieznana. Rozważ następujący zestaw danych: AA...

regression machine-learning algorithms model-selection data-mining

34

Jak interpretować średnią z fabuły Silhouette?

Próbuję użyć wykresu sylwetki, aby określić liczbę klastrów w moim zestawie danych. Biorąc pod uwagę zestaw danych Train , użyłem następującego kodu Matlab Train_data = full(Train); Result = []; for num_of_cluster = 1:20 centroid = kmeans(Train_data,num_of_cluster,'distance','sqeuclid'); s =...

data-visualization clustering matlab

34

Hierarchiczne grupowanie z danymi mieszanego typu - jakiej odległości / podobieństwa użyć?

W moim zestawie danych mamy zarówno zmienne ciągłe, jak i naturalnie dyskretne. Chcę wiedzieć, czy możemy przeprowadzać hierarchiczne grupowanie przy użyciu obu typów zmiennych. A jeśli tak, jaki pomiar odległości jest

clustering similarities distance-functions mixed-type-data

34

Dlaczego źle jest uczyć uczniów, że wartości p to prawdopodobieństwo, że odkrycia wynikają z przypadku?

Czy ktoś może przedstawić mi zwięzłe wyjaśnienie, dlaczego nie warto uczyć studentów, że prob jest wartością p (ich odkrycia wynikają z [losowej] szansy). Rozumiem, że wartość p jest prob (uzyskanie bardziej ekstremalnych danych | hipoteza zerowa jest prawdziwa). Moim prawdziwym zainteresowaniem...

p-value randomness teaching

34

Czy potrafisz się dopasować, trenując algorytmy uczenia maszynowego za pomocą CV / Bootstrap?

To pytanie może być zbyt otwarte, aby uzyskać ostateczną odpowiedź, ale mam nadzieję, że nie. Algorytmy uczenia maszynowego, takie jak SVM, GBM, Random Forest itp., Generalnie mają pewne wolne parametry, które poza pewną wskazówką praktyczną, muszą być dostosowane do każdego zestawu danych....

machine-learning cross-validation bootstrap optimization resampling

34

Różnica między uogólnionymi modelami liniowymi a uogólnionymi liniowymi modelami mieszanymi

Zastanawiam się, jakie są różnice między mieszanymi i niezmieszanymi GLM. Na przykład w SPSS menu rozwijane umożliwia użytkownikom dopasowanie: analyze-> generalized linear models-> generalized linear models I analyze-> mixed models-> generalized linear Czy inaczej radzą sobie z...

mixed-model generalized-linear-model glmm gee