Statystyki i duże zbiory danych

15
Regularyzacja modeli ARIMA

Zdaję sobie sprawę z rodzaju regularyzacji typu LASSO, grzbietu i siatki elastycznej w modelach regresji liniowej. Pytanie: Czy ten (lub podobny) rodzaj oszacowania podlegającego sankcji można zastosować do modelowania ARIMA (z niepustą częścią MA)? Przy budowaniu modeli ARIMA wydaje się, że...

15
istotność różnicy między dwiema liczbami

Czy istnieje sposób ustalenia, czy różnica między liczbą wypadków drogowych w czasie 1 znacznie różni się od liczby wypadków w czasie 2? Znalazłem różne metody określania różnicy między grupami obserwacji w różnych momentach (np. Porównywanie średnich Poissona), ale nie do porównywania tylko...

15
Dlaczego lrtest () nie pasuje do anova (test = „LRT”)

Szukałem sposobów przeprowadzenia testu współczynnika wiarygodności w R, aby porównać pasowania modeli. Po raz pierwszy zakodowany to sam, a następnie znaleźć zarówno domyślną anova()funkcją, a także lrtest()w lmtestpakiecie. Kiedy jednak sprawdziłem, anova()zawsze produkuje nieco inną wartość p od...

15
Co zrobiłeś / zrobiłeś, aby zapamiętać zasadę Bayesa?

Myślę, że dobrym sposobem na zapamiętanie formuły jest pomyślenie o formule w ten sposób: Prawdopodobieństwo, że pewne zdarzenie A ma określony wynik, biorąc pod uwagę wynik niezależnego zdarzenia B = prawdopodobieństwo, że oba wyniki wystąpią jednocześnie / cokolwiek byśmy powiedzieli,...

15
W tym warunki interakcji w losowym lesie

Załóżmy, że mamy odpowiedź Y i predyktory X1, ...., Xn. Gdybyśmy spróbowali dopasować Y za pomocą liniowego modelu X1, ...., Xn, i tak się po prostu stało, że prawdziwy związek między Y i X1, ..., Xn nie był liniowy, moglibyśmy naprawić model, przekształcając jakoś X, a następnie dopasowując model....

15
Metryki do oceny algorytmów rankingowych

Chciałbym przyjrzeć się kilku różnym wskaźnikom algorytmów rankingowych - kilka z nich znajduje się na stronie Wikipedii Uczenie się rangowania, w tym: • Średnia średnia precyzja (MAP); • DCG i NDCG; • Precision @ n, NDCG @ n, gdzie „@n” oznacza, że ​​metryki są oceniane tylko na górnych n...

15
Zrozumienie rozkładu QR

Mam sprawdzony przykład (w R), który próbuję zrozumieć dalej. Używam Limmy do stworzenia modelu liniowego i staram się zrozumieć, co dzieje się krok po kroku w obliczeniach zmiany zagięcia. Głównie próbuję dowiedzieć się, co się dzieje, aby obliczyć współczynniki. Z tego, co mogę zrozumieć, rozkład...

15
Na jakim poziomie test

TŁO: Pomiń bezpiecznie - jest tutaj w celach informacyjnych i uzasadnia pytanie. Otwarcie tego artykułu brzmi: „Słynny test przygodności chi-kwadrat Karla Pearsona pochodzi z innej statystyki, zwanej statystyką z, opartej na rozkładzie normalnym. Najprostsze wersje mogą być matematycznie...