Statystyki i duże zbiory danych

20
Przedział ufności wokół stosunku dwóch proporcji

Mam dwie proporcje (np. Współczynnik klikalności (CTR) na link w układzie kontrolnym i CTR na link w układzie eksperymentalnym) i chcę obliczyć 95% przedział ufności wokół stosunku tych proporcji. Jak mam to zrobic? Wiem, że mogę użyć metody delta do obliczenia wariancji tego współczynnika, ale...

20
Zmiana skali zmiennej na 0-100

Zbudowałem indeks kapitału społecznego za pomocą techniki PCA. Indeks ten zawiera wartości zarówno dodatnie, jak i ujemne. Chcę przekształcić / przekonwertować ten indeks na skalę 0-100, aby ułatwić interpretację. Proszę zasugerować mi najłatwiejszy

20
„Fully Bayesian” vs „Bayesian”

Poznałem statystyki bayesowskie i często czytałem artykuły „przyjmujemy podejście bayesowskie” lub coś podobnego. Rzadko też zauważyłem: „przyjmujemy podejście w pełni bayesowskie” (mój nacisk). Czy istnieje jakaś różnica między tymi podejściami w sensie praktycznym lub teoretycznym?...

20
PCA danych niegaussowskich

Mam kilka szybkich pytań na temat PCA: Czy PCA zakłada, że zestaw danych jest gaussowski? Co się stanie, gdy zastosuję PCA do danych z natury nieliniowych? Biorąc pod uwagę zestaw danych, proces polega najpierw na normalizacji średniej, ustawieniu wariancji na 1, wzięciu SVD, zmniejszeniu...

20
Statystyczna intuicja / wyczucie danych

Jestem studentem drugiego roku, studiuję matematykę, i rozmawiałem z jednym z moich profesorów o różnicy między zdolnościami matematycznymi a zdolnościami statystycznymi. Jedną z kluczowych różnic, które poruszał, był „wyczucie danych”, które wyjaśnił jako połączenie zdolności technicznych podczas...

20
Podstawowe statystyki dla jurorów

Zostałem wezwany do pełnienia obowiązków przysięgłych. Jestem świadomy znaczenia statystyk dla niektórych prób jury. Na przykład koncepcja „stawki podstawowej” i jej zastosowanie do obliczania prawdopodobieństwa jest czasem - być może zawsze - istotna. Jakie tematy statystyczne może pożytecznie...