Stworzyłem uogólnione modele dodatków do wylesiania. Aby uwzględnić autokorelację przestrzenną, uwzględniłem szerokość i długość geograficzną jako wygładzony termin interakcji (tj. S (x, y)).
Oparłem to na przeczytaniu wielu artykułów, w których autorzy mówią: „aby uwzględnić przestrzenną autokorelację, współrzędne punktów zostały uwzględnione jako wygładzone terminy”, ale nigdy nie wyjaśniły, dlaczego tak naprawdę to wyjaśnia. To dość frustrujące. Przeczytałem wszystkie książki, które mogę znaleźć na GAM, w nadziei na znalezienie odpowiedzi, ale większość (np. Uogólnione modele addytywne, wprowadzenie do R, SN Wood) po prostu porusza ten temat bez wyjaśnienia.
Byłbym naprawdę wdzięczny, gdyby ktoś mógł wyjaśnić DLACZEGO uwzględnienie kont szerokości i długości geograficznej dla autokorelacji przestrzennej i co tak naprawdę oznacza „rozliczenie” - czy wystarczy po prostu włączyć to do modelu, czy też należy porównać model z s (x, y) i model bez? I czy odchylenie wyjaśnione tym terminem wskazuje na zakres autokorelacji przestrzennej?
Odpowiedzi:
Głównym problemem w każdym modelu statystycznym są założenia leżące u podstaw każdej procedury wnioskowania. W opisywanym modelu resztki są przyjmowane jako niezależne. Jeśli mają jakąś zależność przestrzenną i nie jest to modelowane w sytematycznej części modelu, reszty z tego modelu będą również wykazywać zależność przestrzenną, lub innymi słowy, będą autokorelowane przestrzennie. Taka zależność unieważniłaby na przykład teorię, która wytwarza wartości p ze statystyk testowych w GAM; nie można ufać wartościom p, ponieważ zostały one obliczone przy założeniu niezależności.
Masz dwie główne opcje przetwarzania takich danych; i) modeluje zależność przestrzenną w systematycznej części modelu, lub ii) rozluźnia założenie niezależności i szacuje korelację między resztami.
i) próbuje się wprowadzić gładką lokalizację przestrzenną w modelu. ii) wymaga oszacowania macierzy korelacji reszt często podczas dopasowania modelu przy użyciu procedury podobnej do uogólnionego najmniejszego kwadratu. To, jak dobrze którekolwiek z tych podejść poradzi sobie z zależnością przestrzenną, będzie zależeć od charakteru i złożoności zależności przestrzennej oraz od tego, jak łatwo można ją modelować.
Podsumowując, jeśli można modelować zależność przestrzenną między obserwacjami, wówczas reszty są bardziej prawdopodobne, że są niezależnymi zmiennymi losowymi, a zatem nie naruszają założeń jakiejkolwiek procedury wnioskowania.
źródło
źródło
Inne odpowiedzi są dobre. Chciałem tylko dodać coś o „rozliczaniu” autokorelacji przestrzennej. Czasami twierdzenie to jest wzmocnione zgodnie z zasadą „rozliczania autokorelacji przestrzennej, która nie jest wyjaśniona przez zmienne towarzyszące”.
Może to przedstawiać mylący obraz tego, co robi gładka przestrzenna. To nie jest tak, że istnieje pewna uporządkowana kolejka, w której prawdopodobieństwo, że wygładzenie cierpliwie czeka, aż zmienne towarzyszące odejdą, a następnie wygładzenie „niewyjaśnionych” części. W rzeczywistości wszyscy mają szansę wyjaśnić dane.
Ten artykuł z trafnie nazwanym tytułem bardzo wyraźnie przedstawia ten problem, chociaż z punktu widzenia modelu CAR zasady dotyczą gładzi GAM.
Dodanie błędów skorelowanych przestrzennie może zepsuć ustalony efekt, który kochasz
„Rozwiązaniem” w papierze jest wygładzenie resztek zamiast wygładzania przestrzeni. Pozwoliłoby to twoim współzmiennym wyjaśnić, co potrafią. Oczywiście istnieje wiele aplikacji, w których nie byłoby to pożądane rozwiązanie.
źródło
Korelacja przestrzenna jest po prostu tym, jak współrzędne xiy odnoszą się do wielkości powstałej powierzchni w przestrzeni. Tak więc autokorelację między współrzędnymi można wyrazić jako funkcjonalną zależność między sąsiednimi punktami.
źródło