Dane: Niedawno pracowałem nad analizą stochastycznych właściwości przestrzenno-czasowego pola błędów prognozowania produkcji energii wiatrowej. Formalnie można powiedzieć, że jest to proces indeksowane dwukrotnie w czasie (przytih), a raz w miejscu (P), zHoznacza liczbę razy LookAhead (czyli co około24regularnie próbki),toznacza liczbę „czasy prognozy” (tj. czasy, w których prognoza jest wydawana, około 30000 w moim przypadku, próbkowanie regularnie), anto liczba pozycji przestrzennych (nie siatkowane, około 300 w moim przypadku). Ponieważ jest to proces związany z pogodą, mam również wiele prognoz pogody, analiz, pomiarów meteorologicznych, które można wykorzystać.
Pytanie: Czy możesz opisać mi analizę eksploracyjną, którą przeprowadziłbyś na tego typu danych, aby zrozumieć naturę struktury współzależności (która może nie być liniowa) procesu, aby zaproponować dokładne modelowanie tego.
źródło
Odpowiedzi:
Wydaje mi się, że dysponujesz wystarczającymi danymi, aby modelować zależność od wpływów czasoprzestrzennych i meteorologicznych zarówno stronniczości błędów prognozowych (tj. Tendencji do systematycznego przeszacowywania / niedoceniania [pierwszej chwili]), jak i ich wariancji [drugiej chwili].
Aby zbadać błąd, po prostu zrobiłbym dużo wykresów rozrzutu, map cieplnych lub wykresów heksbinowych. Aby zbadać zmienność, po prostu wyprostuję oryginalne błędy, a następnie ponownie wykonam wiele wykresów rozrzutu, map cieplnych lub wykresów heksbinowych. Nie jest to oczywiście bezproblemowe, jeśli masz dużo stronniczości, ale nadal może pomóc dostrzec wzorce heteroskedastyczności wpływającej na zmienną towarzyszącą.
R
mboost
źródło
My (kolega i ja) w końcu napisaliśmy artykuł na ten temat. Podsumowując, zaproponowaliśmy dwa rozwiązania w celu kwantyfikacji i przedstawienia statystycznego podsumowania (przestrzenno-czasowego) rozprzestrzeniania się błędów w Danii i wraz z przyszłymi okresami.
Można to wykorzystać do obliczenia globalnego wektora propagacji, tj. Pewnego rodzaju przestrzennej średniej prędkości propagacji między parami. Część tego pokazano po lewej stronie ryc. 1 i zgadnij, jaką propagacją błędów jest West East w Denamrk (ok, to nie była wielka niespodzianka :)). Przeanalizowaliśmy to również warunkowo w różnych sytuacjach meteorologicznych, aby pokazać związek między propagacją a wiatrem (prędkość, kierunek).
W drugim przypadku zaobserwowaliśmy, że średnia czasowa prędkość propagacji ma podobny magnitet, jak uzyskany ze średnią przestrzenną w pierwszym przypadku. Jeśli chcesz poważniej przyjrzeć się tej pracy, papier jest tutaj .
źródło