Mam 20-letni zestaw danych o rocznej liczebności gatunków dla zestawu wielokątów (~ 200 wielokątów o nieregularnym kształcie, ciągłych). Korzystam z analizy regresji, aby wnioskować o trendach (zmianie liczby w ciągu roku) dla każdego wielokąta, a także agregacji danych wielokąta w oparciu o granice zarządzania.
Jestem pewien, że w danych występuje autokorelacja przestrzenna, która z pewnością wpłynie na analizę regresji dla danych zagregowanych. Moje pytanie brzmi - jak uruchomić test SAC dla danych szeregów czasowych? Czy muszę patrzeć na SAC pozostałości z mojej regresji za każdy rok (globalne I Morana)? Czy mogę przeprowadzić jeden test na wszystkie lata?
Czy po sprawdzeniu, że tak, istnieje SAC, czy łatwo było to rozwiązać? Moje tło statystyk jest minimalne, a wszystko, co przeczytałem na temat modelowania czasoprzestrzennego, brzmi bardzo skomplikowanie. Wiem, że R ma funkcję autokowariatu ważoną odległością - czy jest to w ogóle łatwe w użyciu?
Jestem naprawdę bardzo zdezorientowany, jak ocenić / dodać SAC dla tego problemu i bardzo doceniłbym wszelkie sugestie, linki lub referencje. Z góry dziękuję!
Odpowiedzi:
Zgodnie z tym artykułem OLS jest spójny w obecności autokorelacji przestrzennej, ale standardowe błędy są niepoprawne i wymagają korekty. Solomon Hsiang zapewnia do tego celu kod stata i matlab . Niestety nie znam tego kodu R.
Z pewnością istnieją inne podejścia do tego rodzaju problemu w statystyce przestrzennej, które wyraźnie modelują procesy przestrzenne. Ten po prostu zawyża standardowe błędy.
Teoretyczni ekonometrycy niestety wydają się czerpać przyjemność z zaciemniania. Powiązany papier jest naprawdę trudny do odczytania. Zasadniczo uruchamia dowolną regresję, a następnie naprawia standardowe błędy później, tj .: używając kodu z Hsiang. Przestrzeń nie wchodzi w nią, dopóki nie spróbujesz oszacować wariancji swojego estymatora. Intuicyjnie, jeśli cała różnica jest blisko siebie, masz mniej pewności, że twoje oszacowanie nie jest jedynie reliktem jakiegoś niezauważonego szoku przestrzennego.
Zauważ, że musisz określić przepustowość jądra, nad którą według ciebie może działać proces przestrzenny.
Ta odpowiedź jest w zasadzie powtórzeniem kopiowania / wklejania podobnej odpowiedzi, którą tutaj podałem
źródło
Jeśli problemem są błędy autokorelowane, , wówczas OLS jest spójny, ale nieefektywny, jak mówi ACD. To jest jak szeregowa korelacja w ekonometrii szeregów czasowych.y= Xβ+ u , u = ρ W.u + ϵ
Ale jeśli istnieje przestrzenna autozależność (zwana także myląco autokorelacją), , wówczas OLS jest niespójny. To to samo, co brak zmiennego nastawienia. Jeśli masz oba problemy, musisz użyć Spatial Durbin Model, .y = ρ W y + X β + W X λ + ϵy= ρ Wy+ Xβ+ ϵ y= ρ Wy+ Xβ+ W.Xλ + ϵ
Spdep pakiet dla R zawiera liczne funkcje, które obliczają przestrzennych gramatury matryce oszacowanie regresji przestrzennych i robić inne rzeczy. Mam duże doświadczenie z tymi
lagsarlm
funkcjami, ale w dokumentacji pakietu widzę, że istniejesacsarlm
funkcja, która wydaje się być bardziej tym, czego szukasz.Jeśli chodzi o aspekt czasowy problemu, założenia, które przyjmujesz na podstawie zależności, będą miały długą drogę do określenia specyfikacji modelu. Czy twoje obszary współdziałają ze sobą bezpośrednio? Przykładami tego są rynki handlowe lub mieszkaniowe; eksport z jednego kraju jest wysoce zależny od importu w innym, a cena sprzedaży ostatnio kupionych domów stanowi bardzo ważny wkład w cenę sprzedaży domów w pobliżu. W takim przypadku sensowne jest określenie macierzy wag aby uwzględnić tę zależność. Pozwól, aby dom zakupiony w czasie był „sąsiadem” z domami w czasie , ale nie z domami w czasie .t t - 1 t + 1W. t t - 1 t + 1
Jeśli twoje warunki są skorelowane, ale nie są logicznie od siebie zależne, takie jak plony rolne, prawdopodobnie sensowniej byłoby mieć pojedynczą macierz niewrażliwą na czas , ale uwzględnić atrapy roku w specyfikacjiXW. X
źródło