Statystyki i duże zbiory danych

10
D Cohena dla testu t próbki zależnej

Szybkie pytanie: widziałem d Cohena obliczonego na dwa różne sposoby dla testu t zależnych próbek (np. Projekt wewnątrz próbek testujący skuteczność leku z punktami czasowymi przed / po). Wykorzystując standardowe odchylenie wyniku zmiany w mianowniku równania dla d Cohena. Wykorzystanie...

10
Jak udowodnić współpracę z sekwencji behawioralnych

Sytuacja: dwa ptaki (samiec i samica) chronią jaja w gnieździe przed intruzem. Każdy ptak może użyć ataku lub zagrożenia do ochrony i może być obecny lub nieobecny. Z danych wynika, że ​​zachowanie może być komplementarne - ataki mężczyzn, podczas gdy kobiety wykorzystują wyświetlanie zagrożenia i...

10
W CLT dlaczego

Niech X1,...,XnX1,...,XnX_1,...,X_n będą niezależnymi obserwacjami z rozkładu, który ma średnią μμ\mu i wariancję σ2<∞σ2<∞\sigma^2 < \infty , gdy n→∞n→∞n \rightarrow \infty , to n−−√X¯n−μσ→N(0,1).nX¯n−μσ→N(0,1).\sqrt{n}\frac{\bar{X}_n-\mu}{\sigma} \rightarrow N(0,1). Dlaczego oznacza to,...

10
dystrybucja grubych palców

Krótkie pytanie: czy istnieje rozkład grubych palców? Jestem pewien, że jeśli istnieje, to ma inną nazwę. Nie wiem, jak sformułować to jako funkcję analityczną. Czy możesz mi pomóc znaleźć istniejącą wersję lub zacząć formułować ją w coś czystszego niż gigantyczna symulacja? Jest to rozkład...

10
Intuicyjne wyjaśnienie utraty logów

W kilku konkurencjach kaggle punktacja opierała się na „loglossie”. Dotyczy to błędu klasyfikacji. Oto odpowiedź techniczna, ale szukam intuicyjnej odpowiedzi. Naprawdę podobały mi się odpowiedzi na to pytanie dotyczące odległości Mahalanobisa, ale PCA to nie logloss. Mogę wykorzystać wartość,...