Statystyki i duże zbiory danych

11
Próbkowanie Gibbsa dla modelu Isinga

Pytanie do pracy domowej: Rozważ model 1-d Isinga. Niech . wynosi -1 lub +1x=(x1,...xd)x=(x1,...xd)x = (x_1,...x_d)xixix_i π(x)∝e∑39i=1xixi+1π(x)∝e∑i=139xixi+1\pi(x) \propto e^{\sum_{i=1}^{39}x_ix_{i+1}} Zaprojektuj algorytm próbkowania Gibbs do generowania próbek w przybliżeniu z rozkładu...

11
Regresja logistyczna: interpretacja zmiennych ciągłych

Miałem kilka pytań dotyczących interpretacji ilorazów szans dla zmiennych ciągłych w regresji logistycznej. Wydaje mi się, że są to podstawowe pytania dotyczące regresji logistycznej (i prawdopodobnie ogólnie regresji) i chociaż wstydzę się nieco, że nie znam odpowiedzi, przełknę dumę i zapytam,...

11
Przyszłość statystyki

To pytanie przyszło mi do głowy, kiedy siedziałem na publicznym wykładzie na temat nierozwiązanych pytań w matematyce. Powszechnie wiadomo, że wciąż istnieje wiele nierozwiązanych pytań matematycznych. Sprawiło, że pomyślałem o nierozwiązanych problemach w statystyce. Po spędzeniu czasu na...

11
Model losowego przechwytywania vs. GEE

Rozważ losowy model liniowy przechwytujący. Jest to równoważne z regresją liniową GEE z wymienną działającą macierzą korelacji. Załóżmy, że predyktorami są i a współczynniki dla tych predyktorów to , i . Jaka jest interpretacja współczynników w modelu przechwytywania losowego? Czy jest to to samo,...

11
Dopasowane wartości modelu ARMA

Próbuję zrozumieć, w jaki sposób obliczane są dopasowane wartości dla modeli ARMA (p, q). Znalazłem już pytanie dotyczące dopasowanych wartości procesów ARMA, ale nie byłem w stanie tego zrozumieć. Jeśli mam model ARMA (1,1), tj Xt=α1Xt−1+ϵt−β1ϵt−1Xt=α1Xt−1+ϵt−β1ϵt−1X_t =...

11
Intuicja na temat definicji kowariancji

Próbowałem lepiej zrozumieć kowariancję dwóch zmiennych losowych i zrozumieć, jak pierwsza osoba, która o tym pomyślała, doszła do definicji rutynowo stosowanej w statystyce. Poszedłem na wikipedię, aby lepiej to zrozumieć. Z artykułu wynika, że ​​dobra miara kandydata lub ilość dla powinna mieć...

11
Dystrybucja danych procentowych

Mam pytanie dotyczące prawidłowej dystrybucji do użycia przy tworzeniu modelu z moimi danymi. Przeprowadziłem inwentaryzację lasu z 50 działkami, każda działka ma wymiary 20 x 50 m. Dla każdej działki oszacowałem procent korony drzew, która osłania ziemię. Każda działka ma jedną wartość procentową...

11
O co chodzi z uczeniem maszynowym w praktyce?

Jestem nowicjuszem w uczeniu maszynowym (także niektóre statystyki), od dłuższego czasu uczę się wiedzy (algorytmy uczenia nadzorowanego / bez nadzoru, odpowiednie metody optymalizacji, regularyzacje, niektóre filozofie (takie jak kompromis odchylenie biasu?). Wiem, że bez prawdziwej praktyki nie...

11
Algorytm Metropolis Hastings

Muszę przestudiować metody Markov Chain Monte Carlo, a dokładniej muszę przestudiować algorytm Metropolis Hastings i wszystko w tym stylu, jak kryteria konwergencji. Kto może przepisać mi książkę, artykuł lub stronę internetową, które wyjaśniają ten argument przy użyciu prostych terminów, ale nie...

11
Przykłady błędnego zastosowania twierdzenia Bayesa

To pytanie społecznościowe dotyczące przepełnienia matematyki zawierało „przykłady złych argumentów, które dotyczą zastosowania twierdzeń matematycznych w kontekstach niematematycznych”, i stworzyło fascynującą listę patologicznie stosowanej matematyki. Zastanawiam się nad podobnymi przykładami...

11
Zalety odległości Jeffries Matusita

Według niektórych artykułów, które czytam, powszechnie stosuje się odległość Jeffriesa i Matusity. Ale nie mogłem znaleźć wielu informacji na ten temat, z wyjątkiem poniższej formuły JMD (x, y) = ∑(xi−−√2−yi−−√2)2−−−−−−−−−−−−−√2∑(xi2−yi2)22\sqrt[2]{\sum(\sqrt[2]{x_i}-\sqrt[2]{y_i})^2} Jest...

11
Funkcje Percentile Loss

Rozwiązanie problemu: minmE[|m−X|]minmE[|m−X|] \min_{m} \; E[|m-X|] jest dobrze znana jako mediana XXX , ale jak wygląda funkcja utraty dla innych percentyli? Np .: 25. percentyl X jest rozwiązaniem: minmE[L(m,X)]minmE[L(m,X)] \min_{m} \; E[ L(m,X) ] Co to jest LLL w tym...