Statystyki i duże zbiory danych

21

Jak i dlaczego normalizacja wsadowa wykorzystuje średnie ruchome do śledzenia dokładności modelu podczas treningu?

Czytałem artykuł z normalizacji wsadowej (BN) (1) i nie rozumiałem potrzeby używania średnich ruchomych do śledzenia dokładności modelu, a nawet jeśli zaakceptowałem, że było to właściwe, nie rozumiem co dokładnie robią. W moim rozumieniu (co się mylę) w dokumencie wspomniano, że wykorzystuje on...

21

Ograniczona maszyna Boltzmanna: jak jest używana w uczeniu maszynowym?

Tło: Tak, Restricted Boltzmann Machine (RBM) MOŻE być użyty do zainicjowania obciążeń sieci neuronowej. MOŻE być również użyty w sposób „warstwa po warstwie” do zbudowania głębokiej sieci przekonań (to znaczy do trenowania tej warstwy na szczycie -tej warstwy, a następnie do trenowania warstwa na...

machine-learning neural-networks deep-learning deep-belief-networks rbm

21

t-SNE kontra MDS

Czytałem ostatnio kilka pytań na temat t-SNE ( t-Distributed Stochastic Neighbor Embedding ), a także odwiedziłem kilka pytań na temat MDS ( skalowanie wielowymiarowe ). Często stosuje się je analogicznie, więc wydaje się, że dobrym pomysłem jest sprawienie, by pytanie zawierało wiele pytań...

data-visualization dimensionality-reduction multidimensional-scaling tsne

21

Czy można wykorzystać algorytmy uczenia maszynowego lub uczenia głębokiego do „usprawnienia” procesu próbkowania techniki MCMC?

Opierając się na małej wiedzy, którą mam na temat metod MCMC (łańcuch Markowa Monte Carlo), rozumiem, że pobieranie próbek jest kluczową częścią wyżej wspomnianej techniki. Najczęściej stosowanymi metodami próbkowania są Hamiltonian i Metropolis. Czy istnieje sposób wykorzystania uczenia...

machine-learning mcmc monte-carlo markov-process

21

Czy potrzebujemy zestawu testowego, gdy korzystamy z krzyżowej weryfikacji k-fold?

Czytałem o walidacji k-fold i chcę się upewnić, że rozumiem, jak to działa. Wiem, że w przypadku metody wstrzymania dane są podzielone na trzy zestawy, a zestaw testowy jest używany tylko na samym końcu do oceny wydajności modelu, podczas gdy zestaw sprawdzania poprawności służy do dostrajania...

cross-validation validation out-of-sample

21

Czy ktoś może wyjaśnić różnicę między niezależnym a losowym?

Czy w statystyce niezależne i losowe opisują te same cechy? Jaka jest różnica między nimi? Często spotykamy się z opisem takim jak „dwie niezależne zmienne losowe” lub „losowe próbkowanie”. Zastanawiam się, jaka jest dokładnie różnica między nimi. Czy ktoś może to wyjaśnić i podać kilka przykładów?...

distributions sampling randomness

21

Co sprawia, że znaczenie niektórych dystrybucji jest niezdefiniowane?

Wiele plików PDF ma zakres od minus do dodatniej nieskończoności, ale niektóre środki są zdefiniowane, a niektóre nie. Jaka wspólna cecha sprawia, że niektóre są

distributions mean

21

Entropia obrazu

Jaki jest najbardziej poprawny pod względem teoretycznym / informacyjnym sposób obliczenia entropii obrazu? W tej chwili nie dbam o wydajność obliczeniową - chcę, aby teoretycznie była jak najbardziej poprawna. Zacznijmy od obrazu w skali szarości. Jednym intuicyjnym podejściem jest rozważenie...

spatial entropy image-processing

21

PCA w numpy i sklearn daje różne wyniki

Czy coś nie rozumiem? To jest mój kod za pomocą sklearn import numpy as np import matplotlib.pyplot as plt from mpl_toolkits.mplot3d import Axes3D from sklearn import decomposition from sklearn import datasets from sklearn.preprocessing import StandardScaler pca =

pca python scikit-learn

21

Utajona interpretacja zmiennych uogólnionych modeli liniowych (GLM)

Krótka wersja: Wiemy, że regresję logistyczną i regresję probitową można interpretować jako obejmującą ciągłą zmienną ukrytą, która jest dyskretyzowana według pewnego ustalonego progu przed obserwacją. Czy dostępna jest podobna interpretacja zmiennej ukrytej dla, powiedzmy, regresji Poissona? Co...

logistic generalized-linear-model poisson-regression probit latent-variable

21

Empiryczny CDF vs CDF

Uczę się o funkcji empirycznej kumulatywnej dystrybucji. Ale nadal nie rozumiem Dlaczego nazywa się to „empirycznym”? Czy jest jakaś różnica między Empirical CDF a

distributions terminology cdf ecdf

21

Ostrzeżenie „Model nie zbiegło się” w lmer ()

Za pomocą następującego zestawu danych chciałem sprawdzić, czy odpowiedź (efekt) zmienia się w odniesieniu do witryn, sezonu, czasu trwania i ich interakcji. Niektóre internetowe fora poświęcone statystykom sugerowały, żebym kontynuował liniowe modele z efektami mieszanymi, ale problem polega na...

r mixed-model lme4-nlme

21

Jak interpretować błąd średniej kwadratowej (RMSE) vs. odchylenie standardowe?

Powiedzmy, że mam model, który daje mi prognozowane wartości. Obliczam RMSE tych wartości. A potem odchylenie standardowe wartości rzeczywistych. Czy ma sens porównywanie tych dwóch wartości (wariancji)? Myślę, że jeśli RMSE i odchylenie standardowe są podobne / takie same, błąd / wariancja...

standard-deviation standard-error rms

21

Funkcja utraty dla autoencoderów

Eksperymentuję trochę autoencoderów, a dzięki tensorflow stworzyłem model, który próbuje zrekonstruować zestaw danych MNIST. Moja sieć jest bardzo prosta: X, e1, e2, d1, Y, gdzie e1 i e2 są warstwami kodującymi, d2 i Y są warstwami dekodującymi (a Y jest zrekonstruowanym wyjściem). X ma 784...

mse autoencoders tensorflow cross-entropy

21

Po co zgłaszać statystyki opisowe?

Właśnie przeprowadziłem analizę moich danych przy użyciu regresji logistycznej, ale w raporcie muszę też mieć opisową część dotyczącą statystyki. Naprawdę nie rozumiem w tym sensu i miałem nadzieję, że ktoś może wyjaśnić, dlaczego jest to konieczne. Na przykład, jeśli wykreślę histogram jednej z...

descriptive-statistics reporting

21

Korzyści z próbkowania warstwowego vs losowego do generowania danych treningowych w klasyfikacji

Chciałbym wiedzieć, czy są jakieś / jakieś zalety stosowania próbkowania warstwowego zamiast próbkowania losowego, podczas dzielenia oryginalnego zestawu danych na zestaw szkoleniowy i testowy do klasyfikacji. Ponadto, czy próbkowanie warstwowe wprowadza więcej uprzedzeń do klasyfikatora niż...

classification cross-validation random-forest train stratification

21

Różnica między założeniami leżącymi u podstaw korelacji a regresywnymi testami nachylenia istotności

Moje pytanie wyrosło z dyskusji z @whuber w komentarzach do innego pytania . W szczególności komentarz @whuber był następujący: Jednym z powodów, dla których może cię zaskoczyć, jest to, że założenia leżące u podstaw testu korelacji i testu nachylenia regresji są różne - więc nawet jeśli...

regression correlation p-value assumptions

21

Generowanie skorelowanych zmiennych losowych dwumianowych

Zastanawiałem się, czy możliwe jest wygenerowanie skorelowanych losowych zmiennych dwumianowych po zastosowaniu transformacji liniowej? Poniżej wypróbowałem coś prostego w R i daje to pewną korelację. Ale zastanawiałem się, czy istnieje jakiś zasadny sposób, aby to zrobić? X1 = rbinom(1e4, 6, .5)...

r correlation binomial random-generation bernoulli-distribution

21

Pokazuje, że 100 pomiarów dla 5 pacjentów dostarcza znacznie mniej informacji niż 5 pomiarów dla 100 pacjentów

Na konferencji usłyszałem następujące oświadczenie: 100 pomiarów dla 5 osób dostarcza znacznie mniej informacji niż 5 pomiarów dla 100 osób. To trochę oczywiste, że to prawda, ale zastanawiałem się, jak można to udowodnić matematycznie ... Myślę, że można zastosować liniowy model mieszany....

mixed-model variance repeated-measures sample-size intraclass-correlation

21

Jak ulepszyć moją sieć neuronową w przewidywaniu fal sinusoidalnych?

Spójrz: możesz dokładnie zobaczyć, gdzie kończą się dane treningowe. Dane treningowe wynoszą od do .1- 1-1-1111 Użyłem Keras i gęstej sieci 1-100-100-2 z aktywacją tanh. Obliczam wynik z dwóch wartości, p i q jako p / q. W ten sposób mogę uzyskać dowolny rozmiar liczby, używając tylko wartości...

regression neural-networks python keras