Niektóre zastrzeżenia przed kontynuowaniem. Jak często sugeruję moim uczniom, używaj auto.arima()
rzeczy tylko jako pierwsze przybliżenie twojego końcowego wyniku lub jeśli chcesz mieć model oszczędnościowy, gdy sprawdzasz, czy twój rywalizujący model oparty na teorii radzi sobie lepiej.
Dane
Oczywiście musisz zacząć od opisu danych szeregów czasowych, z którymi pracujesz. W makroekonometrii zwykle pracujesz z danymi zagregowanymi, a środki geometryczne (o dziwo) mają więcej dowodów empirycznych dla danych makro szeregów czasowych, prawdopodobnie dlatego, że większość z nich rozkłada się w wykładniczy trend wzrostowy .
Nawiasem mówiąc, sugestia Roba „wizualnie” działa dla szeregów czasowych z wyraźną częścią sezonową , ponieważ powoli zmieniające się dane roczne są mniej jasne dla wzrostu zmienności. Na szczęście zwykle obserwuje się wykładniczo rosnący trend (jeśli wydaje się liniowy, to nie ma potrzeby rejestrowania dzienników).
Model
Jeśli twoja analiza opiera się na teorii, która stwierdza, że pewna ważona średnia geometryczna bardziej znany jako model regresji multiplikatywnej jest tym, z którym musisz pracować. Następnie zwykle przechodzisz do modelu regresji log-log , który ma parametry liniowe i większość twoich zmiennych, ale niektóre stopy wzrostu są przekształcane.Y( t ) = Xα11( t ) . . . Xαkk( t ) ε ( t )
W ekonometrii finansowej dzienniki są powszechne ze względu na popularność zwrotów dzienników, ponieważ ...
Przekształcenia dziennika mają ładne właściwości
W modelu regresji log-log jest interpretacja badanego parametru, np jak elastyczność w na . Y ( t ) X i ( t )αjaY( t )Xja( t )
W modelach korekcji błędów mamy empirycznie silniejsze założenie, że proporcje są bardziej stabilne ( stacjonarne ) niż różnice bezwzględne.
W ekonometrii finansowej łatwo jest agregować zwroty dzienników w czasie .
Istnieje wiele innych powodów, które nie zostały tu wymienione.
Wreszcie
Zauważ, że transformacja log jest zwykle stosowana do zmiennych nieujemnych (poziomowych). Jeśli zaobserwujesz różnice między dwoma szeregami czasowymi (na przykład eksport netto), nie jest nawet możliwe zapisanie dziennika, musisz albo wyszukać oryginalne dane w poziomach, albo przyjąć formę wspólnego trendu, który został odjęty.
[ dodanie po edycji ] Jeśli nadal potrzebujesz statystycznego kryterium, kiedy przeprowadzać transformację logów, prostym rozwiązaniem byłby dowolny test na heteroscedastyczność. W przypadku rosnącej wariancji poleciłbym test Goldfelda-Quandta lub podobny. W R znajduje się w library(lmtest)
i jest oznaczony gqtest(y~1)
funkcją. Po prostu regresuj na zasadzie przechwytywania, jeśli nie masz żadnego modelu regresji, y
jest to twoja zmienna zależna.
Wykreślić wykres danych w funkcji czasu. Jeśli wygląda na to, że zmiana rośnie wraz z poziomem serii, weź dzienniki. W przeciwnym razie modeluj oryginalne dane.
źródło
Po ich owocach poznacie ich
Założeniem (do przetestowania) jest to, że błędy z modelu mają stałą wariancję. Uwaga: nie oznacza to błędów z założonego modelu. Korzystając z prostej analizy graficznej, zasadniczo zakładasz model liniowy w czasie.
Zatem jeśli masz nieodpowiedni model, taki jak może być sugerowany przez przypadkowy wykres danych w czasie, możesz niepoprawnie dojść do wniosku o potrzebie transformacji mocy. Box i Jenkins zrobili to na przykładzie danych linii lotniczych. Nie uwzględnili 3 nietypowych wartości w najnowszych danych, dlatego błędnie doszli do wniosku, że na najwyższym poziomie szeregu występowały większe różnice w wartościach resztkowych.
Więcej informacji na ten temat można znaleźć na stronie http://www.autobox.com/pdfs/vegas_ibf_09a.pdf
źródło
Możesz chcieć przekształcić logi w serie, gdy są one w jakiś sposób naturalnie geometryczne lub gdy wartość czasowa inwestycji oznacza, że będziesz porównywał się do obligacji o minimalnym ryzyku, która ma dodatni zwrot. To sprawi, że będą bardziej „linearyzowalne”, a zatem odpowiednie do prostej różniczkowej relacji nawrotu.
źródło