Statystyki i duże zbiory danych

48
Czy chi-kwadrat jest zawsze testem jednostronnym?

Opublikowany artykuł ( pdf ) zawiera te 2 zdania: Ponadto błędne zgłaszanie może być spowodowane niewłaściwymi przepisami lub brakiem wiedzy na temat testu statystycznego. Na przykład, całkowity df w ANOVA może być uznany za błąd df w raporcie testu , lub badacz może podzielić zgłoszoną wartość...

47
Samouczek statystyki bayesowskiej

Próbuję przyspieszyć w statystykach bayesowskich. Mam trochę tła statystyk (STAT 101), ale nie za dużo - myślę, że mogę zrozumieć wcześniejsze, późniejsze i prawdopodobieństwo: D. Nie chcę jeszcze czytać podręcznika bayesowskiego. Wolałbym czytać ze źródła (preferowana strona internetowa), który...

47
Jak dokonać wyboru podzbioru regresji logistycznej?

Dopasowuję dwumianową rodzinę glm w R i mam całą grupę zmiennych objaśniających i muszę znaleźć najlepsze (R-kwadrat jako miara jest w porządku). Krótko po napisaniu skryptu do przechodzenia między losowymi różnymi kombinacjami zmiennych objaśniających, a następnie nagraniu, które działa najlepiej,...

47
Wyjaśnienie dotyczące interpretacji przedziałów ufności?

Moje obecne rozumienie pojęcia „przedziału ufności z poziomem ufności ” jest to, że jeśli będziemy próbowali obliczyć przedział ufności wiele razy (za każdym razem świeżą próbkę), będzie ona zawierać poprawny parametr z czas.1 - α1−α1−α1 - \alpha1−α1−α1 - \alpha Chociaż zdaję sobie sprawę, że to...

47
Najbardziej mylące terminy statystyczne

My, statystycy, używamy wielu słów w nieco inny sposób niż wszyscy inni. Powoduje to wiele problemów, gdy uczymy lub wyjaśniamy, co robimy. Rozpocznę listę (a teraz dodam kilka definicji, w komentarzach): Moc to zdolność do prawidłowego odrzucenia fałszywej hipotezy zerowej. Zwykle oznacza to...

47
Zrozumienie Naive Bayes

Ze StatSoft, Inc. (2013), Electronic Statistics Textbook , „Naive Bayes Classifier” : Aby zademonstrować koncepcję klasyfikacji Naiwego Bayesa, rozważ przykład pokazany na powyższej ilustracji. Jak wskazano, obiekty można zaklasyfikować jako ZIELONE lub CZERWONE. Moim zadaniem jest...

47
Dlaczego oczekiwanie jest takie samo jak średnia arytmetyczna?

Dzisiaj natknąłem się na nowy temat zatytułowany Oczekiwanie matematyczne. Książka, którą obserwuję, mówi: oczekiwanie jest średnią arytmetyczną zmiennej losowej pochodzącej z dowolnego rozkładu prawdopodobieństwa. Ale definiuje oczekiwanie jako sumę iloczynu niektórych danych i prawdopodobieństwa...

47
Czy splajny nie pasują do danych?

Mój problem : Niedawno spotkałem statystykę, który poinformował mnie, że splajny są przydatne tylko do eksploracji danych i podlegają nadmiernemu dopasowaniu, a zatem nie są przydatne w przewidywaniu. Wolał odkrywać za pomocą prostych wielomianów ... Ponieważ jestem wielkim fanem splajnów, a to...