autokorelacja przestrzenna dla danych szeregów czasowych

11

Mam 20-letni zestaw danych o rocznej liczebności gatunków dla zestawu wielokątów (~ 200 wielokątów o nieregularnym kształcie, ciągłych). Korzystam z analizy regresji, aby wnioskować o trendach (zmianie liczby w ciągu roku) dla każdego wielokąta, a także agregacji danych wielokąta w oparciu o granice zarządzania.

Jestem pewien, że w danych występuje autokorelacja przestrzenna, która z pewnością wpłynie na analizę regresji dla danych zagregowanych. Moje pytanie brzmi - jak uruchomić test SAC dla danych szeregów czasowych? Czy muszę patrzeć na SAC pozostałości z mojej regresji za każdy rok (globalne I Morana)? Czy mogę przeprowadzić jeden test na wszystkie lata?

Czy po sprawdzeniu, że tak, istnieje SAC, czy łatwo było to rozwiązać? Moje tło statystyk jest minimalne, a wszystko, co przeczytałem na temat modelowania czasoprzestrzennego, brzmi bardzo skomplikowanie. Wiem, że R ma funkcję autokowariatu ważoną odległością - czy jest to w ogóle łatwe w użyciu?

Jestem naprawdę bardzo zdezorientowany, jak ocenić / dodać SAC dla tego problemu i bardzo doceniłbym wszelkie sugestie, linki lub referencje. Z góry dziękuję!

Rozza
źródło
1
Czy chcesz modelować leżące u podstaw procesy przestrzenne, czy też chcesz dostosować swoje oszacowanie macierzy wariancji-kowariancji do uwzględnienia autokorelacji przestrzennej?
generic_user
1
A może chcesz zrobić oba ...
gregmacfarlane
Dzięki za odpowiedzi! Wydaje mi się, że moje dane mają przestrzenną samozależność - jest biologiczna i bardzo prawdopodobne, że liczba gatunków w sąsiednich jednostkach wpłynie na jednostki otaczające. Moje jednostki są dość duże, więc zamierzam po prostu użyć opcji „łączenia na krawędziach i narożnikach”, aby ustawić opóźnienie odległości w celu przetestowania SAC. Funkcje R dla modeli SAC wyglądają na wykonalne (wciąż nad moją głową!). Dzięki jeszcze raz.
Rozza
Witamy na stronie Rozzy, należy to zostawić jako komentarz do jednej z odpowiedzi. Pamiętaj jednak, aby głosować na istniejące odpowiedzi, jeśli zawierały one pomocne odpowiedzi, i oznaczyć jedną z nich jako odpowiadającą na twoje pytanie, jeśli uważasz, że zostało ono zadowalająco rozwiązane.
Andy W

Odpowiedzi:

5

Zgodnie z tym artykułem OLS jest spójny w obecności autokorelacji przestrzennej, ale standardowe błędy są niepoprawne i wymagają korekty. Solomon Hsiang zapewnia do tego celu kod stata i matlab . Niestety nie znam tego kodu R.

Z pewnością istnieją inne podejścia do tego rodzaju problemu w statystyce przestrzennej, które wyraźnie modelują procesy przestrzenne. Ten po prostu zawyża standardowe błędy.

Teoretyczni ekonometrycy niestety wydają się czerpać przyjemność z zaciemniania. Powiązany papier jest naprawdę trudny do odczytania. Zasadniczo uruchamia dowolną regresję, a następnie naprawia standardowe błędy później, tj .: używając kodu z Hsiang. Przestrzeń nie wchodzi w nią, dopóki nie spróbujesz oszacować wariancji swojego estymatora. Intuicyjnie, jeśli cała różnica jest blisko siebie, masz mniej pewności, że twoje oszacowanie nie jest jedynie reliktem jakiegoś niezauważonego szoku przestrzennego.

Zauważ, że musisz określić przepustowość jądra, nad którą według ciebie może działać proces przestrzenny.

Ta odpowiedź jest w zasadzie powtórzeniem kopiowania / wklejania podobnej odpowiedzi, którą tutaj podałem

użytkownik_ogólny
źródło
5

Jeśli problemem są błędy autokorelowane, , wówczas OLS jest spójny, ale nieefektywny, jak mówi ACD. To jest jak szeregowa korelacja w ekonometrii szeregów czasowych.y=Xβ+u,u=ρWu+ϵ

Ale jeśli istnieje przestrzenna autozależność (zwana także myląco autokorelacją), , wówczas OLS jest niespójny. To to samo, co brak zmiennego nastawienia. Jeśli masz oba problemy, musisz użyć Spatial Durbin Model, .y = ρ W y + X β + W X λ + ϵy=ρWy+Xβ+ϵy=ρWy+Xβ+WXλ+ϵ

Spdep pakiet dla R zawiera liczne funkcje, które obliczają przestrzennych gramatury matryce oszacowanie regresji przestrzennych i robić inne rzeczy. Mam duże doświadczenie z tymi lagsarlmfunkcjami, ale w dokumentacji pakietu widzę, że istnieje sacsarlmfunkcja, która wydaje się być bardziej tym, czego szukasz.

Jeśli chodzi o aspekt czasowy problemu, założenia, które przyjmujesz na podstawie zależności, będą miały długą drogę do określenia specyfikacji modelu. Czy twoje obszary współdziałają ze sobą bezpośrednio? Przykładami tego są rynki handlowe lub mieszkaniowe; eksport z jednego kraju jest wysoce zależny od importu w innym, a cena sprzedaży ostatnio kupionych domów stanowi bardzo ważny wkład w cenę sprzedaży domów w pobliżu. W takim przypadku sensowne jest określenie macierzy wag aby uwzględnić tę zależność. Pozwól, aby dom zakupiony w czasie był „sąsiadem” z domami w czasie , ale nie z domami w czasie .t t - 1 t + 1Wtt1t+1

Jeśli twoje warunki są skorelowane, ale nie są logicznie od siebie zależne, takie jak plony rolne, prawdopodobnie sensowniej byłoby mieć pojedynczą macierz niewrażliwą na czas , ale uwzględnić atrapy roku w specyfikacjiXWX

gregmacfarlane
źródło
1
Dobry post Myślę, że rozróżnienie, o którym powinien pamiętać OP przy wyborze jednego z dwóch podejść, polega na tym, czy „wynik” w jednym wielokącie wpłynie na wynik jego sąsiadów. Jeśli tak, wybierz podejście gmacfarlane. Jeśli nie, to proponuję jest prostsze.
generic_user