Dlaczego autokorelacja jest tak ważna? Zrozumiałem zasadę tego (tak sądzę ..), ale ponieważ istnieją też przykłady, w których nie dochodzi do autokorelacji, zastanawiam się: czy wszystko w naturze nie jest w jakiś sposób autokorelowane? Ostatni aspekt dotyczy bardziej ogólnego zrozumienia samej autokorelacji, ponieważ, jak wspomniałem, czy każdy stan we wszechświecie nie jest zależny od poprzedniego?
22
Odpowiedzi:
Autokorelacja ma kilka prostych interpretacji, które oznaczają, że procesy i modele nieskorelowane nie:
Zmienna autokorelowana ma pamięć swoich poprzednich wartości. Takie zmienne mają zachowanie, które zależy od tego, co było wcześniej. Pamięć może być długa lub krótka w stosunku do okresu obserwacji; pamięć może być nieskończona; pamięć może być ujemna (tzn. może oscylować). Jeśli twoje wiodące teorie mówią, że przeszłość (zmiennej) pozostaje z nami, to autokorelacja jest tego wyrazem. (Patrz na przykład Boef, SD (2001). Modelowanie relacji równowagi: modele korekcji błędów z danymi silnie autoregresyjnymi . Analiza polityczna , 9 (1), 78–94, a także de Boef, S. i Keele, L. ( 2008). Biorąc czas Poważnie . American Journal of Political Science , 52 (1), 184-200).
Zmienna autokorelowana implikuje układ dynamiczny . Pytania, które zadajemy i odpowiadamy na temat zachowania systemów dynamicznych, są inne niż te, które zadajemy o systemach niedynamicznych. Na przykład kiedy efekty przyczynowe wchodzą do systemu i jak długo efekty z zakłóceń w danym momencie pozostają istotne, są odbierane w języku modeli autokorelowanych. (Patrz na przykład Levins, R. (1998). Dialektyka i teoria systemów . Science & Society , 62 (3), 375–399, ale także cytat z Pesaranu poniżej.)
Zmienna autokorelowana implikuje potrzebę modelowania szeregów czasowych (jeśli nie dynamicznego modelowania systemów). Metodologie szeregów czasowych opierają się na zachowaniach autoregresyjnych (i średniej ruchomej, która jest założeniem modelowym dotyczącym struktury błędów zależnych od czasu), próbując uchwycić istotne szczegóły procesu generowania danych , i stoją w wyraźnym kontraście np. Z zwane „modelami podłużnymi”, które po prostu uwzględniają pewną miarę czasu jako zmienną w skądinąd niedynamicznym modelu bez autokorelacji. Patrz na przykład Pesaran, MH (2015) Szeregi czasowe i dane panelowe w ekonometrii , Nowy Jork, Nowy Jork: Oxford University Press.
Zastrzeżenie: używam „autoregresji” i „autoregresji”, aby sugerować dowolną strukturę pamięci zmiennej w ogóle, niezależnie od krótkoterminowych, długoterminowych, root-unit, wybuchowych itp. Właściwości tego procesu.
źródło
Próba odpowiedzi.
Autokorelacja nie różni się niczym od innych relacji między predyktorami. Tyle tylko, że predyktor i zmienna zależna okazały się być tymi samymi szeregami czasowymi, tylko opóźnionymi.
W rzeczy samej. Tak jak stan każdego obiektu we wszechświecie zależy od każdego innego obiektu, poprzez wszelkiego rodzaju siły fizyczne. Pytanie tylko, czy związek jest wystarczająco silny, aby być wykrywalnym, czy wystarczająco silny, aby pomóc nam w przewidywaniu stanów.
To samo dotyczy autokorelacji. Zawsze tam jest. Pytanie brzmi, czy musimy to modelować, czy też modelowanie to po prostu wprowadza dodatkową niepewność (kompromis wariancji odchylenia), czyniąc nas gorszymi niż nie modelowanie.
Przykład z mojej osobistej pracy: prognozuję sprzedaż w supermarketach. Spożycie mleka przez moje gospodarstwo domowe jest dość regularne. Jeśli nie kupiłem żadnego mleka w ciągu trzech lub czterech dni, są duże szanse, że przyjdę dziś lub jutro, aby kupić mleko. Jeśli supermarket chce prognozować popyt na mleko mojego gospodarstwa domowego , powinien z całą pewnością wziąć pod uwagę tę autokorelację.
Jednak nie jestem jedynym klientem w moim supermarkecie. Może jeszcze 2000 gospodarstw domowych kupuje tam swoje artykuły spożywcze. Spożycie mleka każdego z nich jest ponownie autokorelowane. Ale ponieważ tempo konsumpcji każdego człowieka jest inne, autokorelacja w agregacie jest tak bardzo osłabiona, że modelowanie jej może nie mieć sensu. Zniknął w ogólnym zapotrzebowaniu dziennym, tj. Na przechwytywanie. A ponieważ supermarket nie dba o to, komu sprzedaje mleko, modeluje zagregowany popyt i prawdopodobnie nie obejmuje autokorelacji.
(Tak, istnieje cotygodniowa sezonowość. Jest to rodzaj autokorelacji, ale tak naprawdę zależy od dnia tygodnia, a nie od popytu w tym samym dniu tygodnia tydzień wcześniej, więc jest to bardziej efekt dnia tygodnia niż autokorelacja sezonowa. )
źródło
Po pierwsze, myślę, że masz na myśli, jaki jest cel oceny autokorelacji i radzenia sobie z nią. Jeśli naprawdę masz na myśli „cel autokorelacji”, to jest to filozofia, a nie statystyka.
Po drugie, stany wszechświata są skorelowane z poprzednimi stanami, ale nie każdy problem statystyczny dotyczy poprzednich stanów natury. Wiele badań ma charakter przekrojowy.
Po trzecie, czy musimy go modelować, kiedy już tam jest? Metody zakładają. Większość form regresji zakłada brak autokorelacji (tzn. Błędy są niezależne). Jeśli naruszymy to założenie, nasze wyniki mogą być błędne. Jak daleko źle? Jednym ze sposobów, by to powiedzieć, jest wykonanie zwykłej regresji, a także jakiegoś modelu uwzględniającego autokorelację (np. Modele wielopoziomowe lub metody szeregów czasowych) i sprawdzenie, jak różne są wyniki. Ale myślę, że ogólnie rzecz biorąc, uwzględnienie autokorelacji zmniejszy szum i sprawi, że model będzie dokładniejszy.
źródło