Statystyki i duże zbiory danych

13
LARS vs zejście współrzędnych dla lasso

Jakie są zalety i wady korzystania z LARS [1] w porównaniu ze stosowaniem opadania współrzędnych w celu dopasowania regresji liniowej regulowanej przez L1? Interesują mnie głównie aspekty wydajności (moje problemy występują zwykle Nw setkach tysięcy i p<20). Jednak wszelkie inne spostrzeżenia...

13
Czy iloraz wiarygodności i porównanie modelu Bayesa stanowią doskonałą i wystarczającą alternatywę dla testowania zerowej hipotezy?

W odpowiedzi na rosnącą liczbę statystyk i badaczy krytykujących użyteczność testowania zerowej hipotezy (NHT) dla nauki jako kumulatywnego przedsięwzięcia, grupa zadaniowa American Psychological Association ds. Wnioskowania statystycznego uniknęła całkowitego zakazu NHT, ale zasugerowała, że...

13
Zrozumienie porównań wyników grupowania

Eksperymentuję z klasyfikowaniem danych do grup. Jestem całkiem nowy w tym temacie i staram się zrozumieć wyniki niektórych analiz. Korzystając z przykładów z Quick-R , Rsugerowanych jest kilka pakietów. Próbowałem użyć dwóch z tych pakietów ( fpcużywając kmeansfunkcji i mclust). Jednym aspektem...

13
Regresja logistyczna z danymi kierunkowymi jak IV

Szukam dobrych referencji na temat używania danych kierunkowych (miara kierunku w stopniach) jako niezależnej zmiennej w regresji; idealnie byłoby to również przydatne w przypadku hierarchicznych modeli nieliniowych (dane są zagnieżdżone). Interesują mnie również dane kierunkowe bardziej...

13
Interpretacja pasków zakresu w wykresie R.'s.stl?

Mam problem z ustaleniem, co plot.stldokładnie oznaczają słupki zasięgu . Znalazłem post Gavina na to pytanie i przeczytałem również dokumentację, rozumiem, że mówią one o względnej wielkości rozłożonych komponentów, ale nadal nie jestem całkowicie pewien, jak działają. Na przykład: dane: malutki...