Próbuję zrozumieć artykuł na temat prognozowania obciążenia elektrycznego, ale walczę z zawartymi w nim koncepcjami, zwłaszcza modelem SARIMAX . Ten model służy do przewidywania obciążenia i wykorzystuje wiele pojęć statystycznych, których nie rozumiem (jestem studentem informatyki na studiach licencjackich - możesz uznać mnie za laika w statystyce). Nie muszę całkowicie rozumieć, jak to działa, ale chciałbym przynajmniej intuicyjnie zrozumieć, co się dzieje.
Próbowałem podzielić SARIMAX na mniejsze części i próbować zrozumieć każdy z tych elementów osobno, a następnie złożyć je razem. Czy możecie mi pomóc? Oto co mam do tej pory.
Zacząłem od AR i MA.
AR : Autoregresja . Nauczyłem się, czym jest regresja, i z mojego zrozumienia wynika po prostu odpowiedź na pytanie: biorąc pod uwagę zestaw wartości / punktów, jak mogę znaleźć model, który wyjaśnia te wartości? Mamy więc na przykład regresję liniową, która próbuje znaleźć linię, która może wyjaśnić wszystkie te punkty. Autoregresja to regresja, która próbuje wyjaśnić wartości na podstawie ich poprzednich wartości.
MA : Średnia ruchoma . Właściwie jestem tutaj całkiem zagubiony. Wiem, czym jest średnia ruchoma, ale model średniej ruchomej nie wydaje się mieć nic wspólnego z „normalną” średnią ruchomą. Formuła modelu wydaje się niezręcznie podobna do AR i wydaje mi się, że nie rozumiem żadnej z koncepcji, które znajduję w Internecie. Jaki jest cel MA? Jaka jest różnica między MA a AR?
Więc teraz mamy ARiMR. Następnie I pochodzi ze zintegrowanego , który, o ile rozumiem, służy po prostu temu, aby pozwolić modelowi ARMA mieć tendencję, albo zwiększającą się, albo malejącą. (Czy to równoznaczne z powiedzeniem ARIMA pozwala na niestacjonarność?)
Teraz pojawia się S od sezonu , co dodaje okresowości do ARIMA, co w zasadzie mówi, na przykład w przypadku prognozowania obciążenia, że obciążenie wygląda bardzo podobnie codziennie o 18:00.
Wreszcie X , od zmiennych egzogenicznych , co w zasadzie pozwala na uwzględnienie zmiennych zewnętrznych w modelu, takich jak prognozy pogody.
W końcu mamy SARIMAX! Czy moje wyjaśnienia są w porządku? Uznaj, że te wyjaśnienia nie muszą być ściśle poprawne. Czy ktoś może mi wyjaśnić, co MA robi intuicyjnie?
źródło
Odpowiedzi:
Jak można zauważyć, (1) model AR odnosi wartość obserwacji w czasie t do poprzednich wartości, z pewnym błędem: x t = φ x t - 1 + ε t substytut Let w x t -x t
Widząc to, przepiszmy teraz naszą definicję (1). Proces AR wiąże wartość obserwacji w czasie t z nieskończoną sekwencją zanikających szoków błędów ε z poprzednich okresów czasu (których nie obserwujemy bezpośrednio).x t ε
Więc czym jest proces MA może być teraz jaśniejszy. (2) Proces MA ( ) wiąże wartość obserwacji x w czasie t z tylko q wyładowaniami błęduq x t q poprzednich okresów (które nie są bezpośrednio zaobserwować), których współczynniki mogą różnić się więcej niż wykładniczy zanik ukryte w modelu AR. Jak zauważyłeś, nie ma to nic wspólnego ze zwykłą koncepcją „średniej ruchomej”.
źródło