Statystyki i duże zbiory danych

27
Czy korelacja zakłada stacjonarność danych?

Analiza międzyrynkowa jest metodą modelowania zachowań rynkowych poprzez znajdowanie relacji między różnymi rynkami. Często oblicza się korelację między dwoma rynkami, powiedzmy S&P 500 i 30-letnimi amerykańskimi skarbami. Obliczenia te najczęściej oparte są na danych cenowych, co jest...

27
Dlaczego priory Jeffreysa uważane są za nieinformacyjne?

Rozważmy Jeffreysa przed gdzie , gdzie jest informacją Fishera.p(θ)∝|i(θ)|−−−−√p(θ)∝|i(θ)|p(\theta) \propto \sqrt{|i(\theta)|}iii Nadal widzę, że ten uprzedzenie jest wymieniany jako nieinformacyjny, ale nigdy nie widziałem argumentu, dlaczego jest on nieinformacyjny. W końcu nie jest to stały...

27
Trend STL szeregów czasowych przy użyciu R.

Jestem nowy w R i analizie szeregów czasowych. Próbuję znaleźć trend w długim (40 lat) dziennym szeregu czasowym temperatur i próbowałem różnych przybliżeń. Pierwszy to po prostu prosta regresja liniowa, a drugi to Sezonowy rozkład szeregów czasowych według Loessa. W tym ostatnim wydaje się, że...

27
Znaczenie wartości p w regresji

To pytanie zostało przeniesione z Mathematics Stack Exchange, ponieważ można na nie odpowiedzieć podczas weryfikacji krzyżowej. Migrował 8 lat temu . Kiedy wykonuję regresję liniową w niektórych pakietach oprogramowania (na przykład Mathematica), otrzymuję wartości p...

27
Czy wybielanie jest zawsze dobre?

Częstym etapem wstępnego przetwarzania algorytmów uczenia maszynowego jest wybielanie danych. Wydaje się, że zawsze dobrze jest wybielić, ponieważ dekoreluje dane, co ułatwia modelowanie. Kiedy wybielanie nie jest zalecane? Uwaga: mam na myśli dekorelację