Statystyki i duże zbiory danych

56
Czy „hybryda” między podejściem Fishera i Neymana-Pearsona do testów statystycznych jest rzeczywiście „niespójnym miszmaszem”?

Istnieje pewna szkoła myślenia, zgodnie z którą najbardziej rozpowszechnionym podejściem do testowania statystycznego jest „hybryda” między dwoma podejściami: podejściem Fishera i podejściem Neymana-Pearsona; te dwa podejścia, jak głosi twierdzenie, są „niezgodne”, a zatem wynikowa „hybryda” jest...

56
Wyzwania dla przemysłu i Kaggle. Czy zbieranie większej liczby obserwacji i dostęp do większej liczby zmiennych jest ważniejsze niż fantazyjne modelowanie?

Mam nadzieję, że tytuł jest oczywisty. W Kaggle większość zwycięzców używa układania w stosy z czasami setkami modeli podstawowych, aby wycisnąć kilka dodatkowych% MSE, dokładność ... Ogólnie rzecz biorąc, z twojego doświadczenia wynika, jak ważne jest wymyślne modelowanie, takie jak układanie w...

56
Czy błędne jest sformułowanie „1 na 80 zgonów jest spowodowany wypadkiem samochodowym”, ponieważ „1 na 80 osób umiera w wyniku wypadku samochodowego?”

Oświadczenie pierwsze (S1): „Jedna na 80 ofiar śmiertelnych jest spowodowana wypadkiem samochodowym”. Oświadczenie drugie (S2): „Jedna na 80 osób umiera w wyniku wypadku samochodowego”. Teraz osobiście nie widzę żadnej różnicy między tymi dwoma stwierdzeniami. Pisząc, uważałbym je za wymienne...

55
Który pseudo

Mam SPSSdane wyjściowe dla modelu regresji logistycznej. Dane wyjściowe zgłaszają dwie miary dopasowania modelu Cox & Snelloraz Nagelkerke. Więc z reguły, które z tych mierników jako pasujące do modelu?R2R²R^² Lub który z tych dopasowanych wskaźników jest zwykle zgłaszany w...

55
Test Walda na regresję logistyczną

O ile rozumiem test Walda w kontekście regresji logistycznej służy do ustalenia, czy określona zmienna predykcyjna jest znacząca, czy nie. Odrzuca hipotezę zerową odpowiadającego współczynnikowi równego zero.XXX Test polega na podzieleniu wartości współczynnika przez błąd standardowy...

55
Dlaczego skurcz działa?

W celu rozwiązania problemów związanych z wyborem modelu, szereg metod (LASSO, regresja kalenicy itp.) Zmniejszy współczynniki zmiennych predykcyjnych w kierunku zera. Szukam intuicyjnego wyjaśnienia, dlaczego poprawia to zdolność przewidywania. Jeśli prawdziwy efekt zmiennej był w rzeczywistości...

55
Jakie są przykłady praktyk anachronicznych w statystyce?

Mam na myśli praktyki, które nadal utrzymują swoją obecność, mimo że problemy (zwykle obliczeniowe), z którymi zostały zaprojektowane, zostały w większości rozwiązane. Na przykład wymyślono korektę ciągłości Yatesa w celu przybliżenia dokładnego testu Fishera za pomocą testu , ale nie jest to już...