Statystyki i duże zbiory danych

17
Terminy błędów modelu średniej ruchomej

To jest podstawowe pytanie dotyczące modeli Box-Jenkins MA. Jak rozumiem, model MA jest zasadniczo liniową regresję szeregów czasowych wartości YYY przeciwko poprzednich kadencjach błędach et,...,et−net,...,et−ne_t,..., e_{t-n} . Oznacza to, że obserwacja YYY najpierw regresji na jej poprzednich...

17
Normalizacja przed walidacją krzyżową

Czy dane normalizujące (mające zerową średnią i odchylenie standardowe jedności) przed powtórzeniem k-krotnej walidacji krzyżowej mają jakieś negatywne konsekwencje, takie jak nadmierne dopasowanie? Uwaga: dotyczy to sytuacji, gdy # skrzynki> łączna liczba funkcji Przekształcam niektóre moje...

17
Częstotliwość i priory

Robby McKilliam mówi w komentarzu do tego postu: Należy zauważyć, że z punktu widzenia częstych nie ma powodu, dla którego nie można włączyć wcześniejszej wiedzy do modelu. W tym sensie widok częstych jest prostszy, masz tylko model i niektóre dane. Nie ma potrzeby oddzielania wcześniejszych...

17
Czy solidne metody są naprawdę lepsze?

Mam dwie grupy badanych, A i B, każda o wielkości około 400 i około 300 predyktorów. Moim celem jest zbudowanie modelu predykcyjnego dla zmiennej odpowiedzi binarnej. Mój klient chce zobaczyć wynik zastosowania modelu zbudowanego z A na B. (W swojej książce „Strategie modelowania regresji”...

17
Jak działa standardowy błąd?

Ostatnio przyglądałem się wewnętrznym działaniom standardowego błędu i nie byłem w stanie zrozumieć, jak to działa. Rozumiem błąd standardowy, ponieważ jest to standardowe odchylenie rozkładu średnich próbek. Moje pytania to: • skąd wiemy, że błąd standardowy oznacza odchylenie standardowe próbki,...