Statystyki i duże zbiory danych

44
Dlaczego ktoś miałby stosować podejście bayesowskie z „nieinformacyjnym” niewłaściwym wcześniejszym podejściem zamiast klasycznego?

Jeśli zainteresowanie polega jedynie na oszacowaniu parametrów modelu (oszacowanie punktowe i / lub przedziałowe), a wcześniejsze informacje nie są wiarygodne, słabe (wiem, że jest to trochę niejasne, ale staram się ustalić scenariusz, w którym wybór wcześniejsze jest trudne) ... Dlaczego ktoś...

44
Dlaczego statystycy twierdzą, że nieistotny wynik oznacza „nie można odrzucić wartości zerowej” w przeciwieństwie do przyjęcia hipotezy zerowej?

Tradycyjne testy statystyczne, takie jak test t dwóch próbek, koncentrują się na próbie wyeliminowania hipotezy, że nie ma różnicy między funkcją dwóch niezależnych próbek. Następnie wybieramy poziom ufności i mówimy, że jeśli różnica średnich przekracza poziom 95%, możemy odrzucić hipotezę zerową....

44
Czy ważne jest skalowanie danych przed grupowaniem?

Znalazłem ten samouczek , który sugeruje, że powinieneś uruchomić funkcję skalowania na elementach przed grupowaniem (uważam, że konwertuje dane do wyników Z). Zastanawiam się, czy to konieczne. Pytam głównie dlatego, że nie mam łokcia, gdy nie skaluję danych, ale znika, gdy jest skalowane....

44
Statystyki publikowane w artykułach naukowych

Czytam wiele ewolucyjnych / ekologicznych artykułów akademickich, czasami w konkretnym celu, aby zobaczyć, jak statystyki są wykorzystywane „w prawdziwym świecie” poza podręcznikiem. Zwykle traktuję statystyki w gazetach jako ewangelię i używam ich do pomocy w nauce statystycznej. W końcu, jeśli...

44
Jaki jest twój ulubiony wykres statystyczny?

To mój ulubiony Ten przykład jest w humorystyczny sposób (podziękowania należą się mojemu byłemu profesorowi, Stevenowi Gortmakerowi), ale interesują mnie również wykresy, w których czujesz się pięknie i przekazujesz wgląd lub metodę statystyczną wraz z twoimi pomysłami na ten temat. Jeden wpis...

44
Czym dokładnie jest Big Data?

Kilkakrotnie zadawano mi pytanie: Co to jest Big-Data? Zarówno przez studentów, jak i moich krewnych, którzy podnoszą szum wokół statystyk i ML. Znalazłem ten CV . I czuję, że zgadzam się z jedyną tam odpowiedzią. Strona Wikipedii również ma na ten temat kilka uwag, ale nie jestem pewien,...

44
Która funkcja aktywacji dla warstwy wyjściowej?

Chociaż wybór funkcji aktywacji dla ukrytej warstwy jest dość jasny (głównie sigmoid lub tanh), zastanawiam się, jak zdecydować o funkcji aktywacji dla warstwy wyjściowej. Często wybierane są funkcje liniowe, funkcje sigmoidalne i funkcje softmax. Kiedy jednak powinienem użyć...

43
Co to jest różnica w różnicach?

Różnica różnic od dawna jest popularna jako narzędzie nie eksperymentalne, zwłaszcza w ekonomii. Czy ktoś może udzielić jasnej i nietechnicznej odpowiedzi na następujące pytania dotyczące różnic w różnicach. Co to jest estymator różnicy w różnicach? Dlaczego estymator różnicy w różnicach jest...

43
Przegląd statystyki w artykułach

Dla niektórych z nas papiery sędziowskie są częścią pracy. Uważając, że sędziując dokumenty dotyczące metodologii statystycznej, porady z innych dziedzin są dość przydatne, tj. Informatyka i matematyka . To pytanie dotyczy przeglądu częściej stosowanych prac statystycznych. Rozumiem przez to, że...