Statystyki i duże zbiory danych

11

Jak przewidujemy rzadkie zdarzenia?

Pracuję nad opracowaniem modelu przewidywania ryzyka ubezpieczeniowego. Modele te mają „rzadkie zdarzenia”, takie jak przewidywanie braku linii lotniczych, wykrywanie usterek sprzętowych itp. Przygotowując zestaw danych, próbowałem zastosować klasyfikację, ale nie mogłem uzyskać przydatnych...

11

Testowanie, czy dwa współczynniki regresji są znacząco różne (idealnie w R)

Jeśli jest to duplikat pytania, proszę wskazać właściwą drogę, ale podobne pytania, które tu znalazłem, nie były wystarczająco podobne. Załóżmy, że oceniam model Y=α+βX+uY=α+βX+uY=\alpha + \beta X + u i znajdź . Okazuje się jednak, że X = X 1 + X 2 i podejrzewam ∂ Y / ∂ X 1 ≠ ∂ Y / ∂ X 2 , a w...

r regression hypothesis-testing econometrics

11

Różnica między ep-SVR i nu-SVR (i SVR metodą najmniejszych kwadratów)

Próbuję dowiedzieć się, który SVR jest odpowiedni dla tego rodzaju danych. Znam 4 typy SVR: epsilon nu najmniejszych kwadratów i liniowy. Rozumiem, że liniowy SVR przypomina mniej więcej lasso z L1 Reg, ale jaka jest różnica między pozostałymi 3 technikami?

regression svm

11

Próbkowanie Gibbsa dla modelu Isinga

Pytanie do pracy domowej: Rozważ model 1-d Isinga. Niech . wynosi -1 lub +1x=(x1,...xd)x=(x1,...xd)x = (x_1,...x_d)xixix_i π(x)∝e∑39i=1xixi+1π(x)∝e∑i=139xixi+1\pi(x) \propto e^{\sum_{i=1}^{39}x_ix_{i+1}} Zaprojektuj algorytm próbkowania Gibbs do generowania próbek w przybliżeniu z rozkładu...

self-study sampling mcmc gibbs

11

Dlaczego dostaję entropię informacji większą niż 1?

Zaimplementowałem następującą funkcję do obliczania entropii: from math import log def calc_entropy(probs): my_sum = 0 for p in probs: if p > 0: my_sum += p * log(p, 2) return - my_sum Wynik: >>> calc_entropy([1/7.0, 1/7.0, 5/7.0]) 1.1488348542809168 >>> from...

mathematical-statistics python entropy

11

Regresja logistyczna: interpretacja zmiennych ciągłych

Miałem kilka pytań dotyczących interpretacji ilorazów szans dla zmiennych ciągłych w regresji logistycznej. Wydaje mi się, że są to podstawowe pytania dotyczące regresji logistycznej (i prawdopodobnie ogólnie regresji) i chociaż wstydzę się nieco, że nie znam odpowiedzi, przełknę dumę i zapytam,...

regression logistic

11

Przyszłość statystyki

To pytanie przyszło mi do głowy, kiedy siedziałem na publicznym wykładzie na temat nierozwiązanych pytań w matematyce. Powszechnie wiadomo, że wciąż istnieje wiele nierozwiązanych pytań matematycznych. Sprawiło, że pomyślałem o nierozwiązanych problemach w statystyce. Po spędzeniu czasu na...

self-study philosophical

11

Co jeśli prawdopodobieństwo nie jest równe w „Regule .632?”

To pytanie pochodzi od tego, które dotyczy „Reguły .632”. Piszę ze szczególnym uwzględnieniem odpowiedzi / notacji użytkownika user603 w zakresie, w jakim upraszcza to sprawę. Ta odpowiedź zaczyna się od próbki o wielkości z zamianą, z różnych elementów w kolekcji (wywołaj) it N....

probability sampling

11

Model losowego przechwytywania vs. GEE

Rozważ losowy model liniowy przechwytujący. Jest to równoważne z regresją liniową GEE z wymienną działającą macierzą korelacji. Załóżmy, że predyktorami są i a współczynniki dla tych predyktorów to , i . Jaka jest interpretacja współczynników w modelu przechwytywania losowego? Czy jest to to samo,...

mixed-model

11

Dopasowane wartości modelu ARMA

Próbuję zrozumieć, w jaki sposób obliczane są dopasowane wartości dla modeli ARMA (p, q). Znalazłem już pytanie dotyczące dopasowanych wartości procesów ARMA, ale nie byłem w stanie tego zrozumieć. Jeśli mam model ARMA (1,1), tj Xt=α1Xt−1+ϵt−β1ϵt−1Xt=α1Xt−1+ϵt−β1ϵt−1X_t =...

arma

11

Intuicja na temat definicji kowariancji

Próbowałem lepiej zrozumieć kowariancję dwóch zmiennych losowych i zrozumieć, jak pierwsza osoba, która o tym pomyślała, doszła do definicji rutynowo stosowanej w statystyce. Poszedłem na wikipedię, aby lepiej to zrozumieć. Z artykułu wynika, że dobra miara kandydata lub ilość dla powinna mieć...

correlation covariance

11

Dystrybucja danych procentowych

Mam pytanie dotyczące prawidłowej dystrybucji do użycia przy tworzeniu modelu z moimi danymi. Przeprowadziłem inwentaryzację lasu z 50 działkami, każda działka ma wymiary 20 x 50 m. Dla każdej działki oszacowałem procent korony drzew, która osłania ziemię. Każda działka ma jedną wartość procentową...

distributions binomial gamma-distribution

11

O co chodzi z uczeniem maszynowym w praktyce?

Jestem nowicjuszem w uczeniu maszynowym (także niektóre statystyki), od dłuższego czasu uczę się wiedzy (algorytmy uczenia nadzorowanego / bez nadzoru, odpowiednie metody optymalizacji, regularyzacje, niektóre filozofie (takie jak kompromis odchylenie biasu?). Wiem, że bez prawdziwej praktyki nie...

machine-learning algorithms

11

Jak trenować regresję (logistyczną?) W R za pomocą funkcji utraty L1?

Potrafię trenować regresję logistyczną w zakresie Rkorzystania glm(y ~ x, family=binomial(logit))) ale IIUC optymalizuje to pod kątem prawdopodobieństwa dziennika. Czy istnieje sposób wytrenowania modelu za pomocą funkcji straty liniowej ( L.1L1L_1 ) (która w tym przypadku jest taka sama jak...

logistic

11

Czy f-Measure jest synonimem dokładności?

Rozumiem, że miara f (oparta na precyzji i przywołaniu) jest oszacowaniem dokładności klasyfikatora. Ponadto, gdy mamy niezrównoważony zestaw danych , f-miara jest ważniejsza od dokładności . Mam proste pytanie (które dotyczy bardziej prawidłowej terminologii niż technologii). Mam niezrównoważony...

machine-learning classification data-mining unbalanced-classes accuracy

11

Algorytm Metropolis Hastings

Muszę przestudiować metody Markov Chain Monte Carlo, a dokładniej muszę przestudiować algorytm Metropolis Hastings i wszystko w tym stylu, jak kryteria konwergencji. Kto może przepisać mi książkę, artykuł lub stronę internetową, które wyjaśniają ten argument przy użyciu prostych terminów, ale nie...

references mcmc

11

Przykłady błędnego zastosowania twierdzenia Bayesa

To pytanie społecznościowe dotyczące przepełnienia matematyki zawierało „przykłady złych argumentów, które dotyczą zastosowania twierdzeń matematycznych w kontekstach niematematycznych”, i stworzyło fascynującą listę patologicznie stosowanej matematyki. Zastanawiam się nad podobnymi przykładami...

bayesian

11

Dlaczego PCA maksymalizuje całkowitą wariancję projekcji?

Christopher Bishop pisze w swojej książce Pattern Recognition and Machine Learning dowód, że każdy kolejny główny składnik maksymalizuje wariancję projekcji do jednego wymiaru, po tym jak dane zostaną rzutowane do przestrzeni ortogonalnej na wcześniej wybrane komponenty. Inne pokazują podobne...

machine-learning variance pca dimensionality-reduction eigenvalues

11

Zalety odległości Jeffries Matusita

Według niektórych artykułów, które czytam, powszechnie stosuje się odległość Jeffriesa i Matusity. Ale nie mogłem znaleźć wielu informacji na ten temat, z wyjątkiem poniższej formuły JMD (x, y) = ∑(xi−−√2−yi−−√2)2−−−−−−−−−−−−−√2∑(xi2−yi2)22\sqrt[2]{\sum(\sqrt[2]{x_i}-\sqrt[2]{y_i})^2} Jest...

classification k-nearest-neighbour euclidean

11

Funkcje Percentile Loss

Rozwiązanie problemu: minmE[|m−X|]minmE[|m−X|] \min_{m} \; E[|m-X|] jest dobrze znana jako mediana XXX , ale jak wygląda funkcja utraty dla innych percentyli? Np .: 25. percentyl X jest rozwiązaniem: minmE[L(m,X)]minmE[L(m,X)] \min_{m} \; E[ L(m,X) ] Co to jest LLL w tym...

expected-value loss-functions