Pytania oznaczone «outliers»

13
Oddzielenie dwóch populacji od próbki

Próbuję oddzielić dwie grupy wartości od jednego zestawu danych. Mogę założyć, że jedna z populacji jest normalnie rozmieszczona i ma co najmniej połowę wielkości próbki. Wartości drugiego są zarówno niższe, jak i wyższe niż wartości pierwszego (rozkład jest nieznany). Staram się znaleźć górne i...

13
LARS vs zejście współrzędnych dla lasso

Jakie są zalety i wady korzystania z LARS [1] w porównaniu ze stosowaniem opadania współrzędnych w celu dopasowania regresji liniowej regulowanej przez L1? Interesują mnie głównie aspekty wydajności (moje problemy występują zwykle Nw setkach tysięcy i p<20). Jednak wszelkie inne spostrzeżenia...

12
Różnice między PROC Mixed i lme / lmer w R - stopnie swobody

Uwaga: to pytanie jest repost, ponieważ moje poprzednie pytanie musiało zostać usunięte ze względów prawnych. Porównując PROC MIXED z SAS z funkcją lmez nlmepakietu w R, natknąłem się na pewne dość mylące różnice. Mówiąc dokładniej, stopnie swobody w różnych testach różnią się między PROC MIXEDi...

12
Jak uwzględnić wpływ prognozowanych świąt

Mam dość przewidywalne dzienne szeregi czasowe z tygodniową sezonowością. Jestem w stanie wymyślić prognozy, które wydają się dość dokładne (potwierdzone przez krzyżową weryfikację), gdy nie ma wakacji. Jednak gdy są święta, mam następujące problemy: W mojej prognozie dostaję niezerowe liczby...

12
Dobra forma do usuwania wartości odstających?

Pracuję nad statystykami dla kompilacji oprogramowania. Mam dane dla każdego kompilacji na pass / fail i upływający czas i generujemy ~ 200 z nich / tydzień. Wskaźnik skuteczności można łatwo agregować, mogę powiedzieć, że 45% minęło w danym tygodniu. Ale chciałbym również zsumować upływający czas...

11
Znajdowanie średniego punktu GPS

Muszę napisać program, aby znaleźć średni punkt GPS z populacji punktów. W praktyce dzieje się tak: Każdego miesiąca osoba rejestruje punkt GPS tego samego zasobu statycznego. Ze względu na charakter GPS punkty te różnią się nieznacznie każdego miesiąca. Czasami osoba popełnia błąd i zapisuje...

11
Automatyczny wybór funkcji do wykrywania anomalii

Jaki jest najlepszy sposób automatycznego wybierania funkcji do wykrywania anomalii? Zazwyczaj traktuję Wykrywanie Anomalii jako algorytm, w którym cechy są wybierane przez ludzkich ekspertów: liczy się zakres wyjściowy (jak w „nienormalnym wejściu - nienormalnym wyjściu”), więc nawet przy wielu...

11
Solidne oszacowanie kurtozy?

Używam zwykłego estymatora kurtozy, , ale zauważam, że nawet małe „odstające” w moim rozkładzie empirycznym , tj. małe szczyty daleko od centrum, wpływają na to ogromnie. Czy istnieje estymator kurtozy, który jest bardziej