Dlaczego musisz dostarczyć model wariogramu, gdy krigujesz?

9

Jestem zupełnie nowy w statystyce przestrzennej i oglądam wiele samouczków,

Ale tak naprawdę nie rozumiem, dlaczego musisz dostarczyć model wariogramu, kiedy krige.

Korzystam z pakietu gstat w R, a oto przykład, który dają:

library(sp)
data(meuse)
coordinates(meuse) = ~x+y
data(meuse.grid)
str(meuse.grid)
gridded(meuse.grid) = ~x+y
m <- vgm(.59, "Sph", 874, .04)
print(m)
# ordinary kriging:
x <- krige(log(zinc)~1, meuse, meuse.grid, model = m)

Czy ktoś jest w stanie wyjaśnić w kilku wierszach, dlaczego najpierw musisz dostarczyć vgm? A jak ustawić parametry?

Z góry dziękuję! Kasper

Kasper
źródło
W przypadku prostego krigowania estymator jest NIEBIESKI tylko wtedy, gdy średnia i przestrzenna kowariancja są znane z wyprzedzeniem. W zwykłym krigingu szacuje się wariogram na podstawie danych, a następnie interpoluje. Zobacz winietę z gstatpakietu R tych samych danych muse.
Andy W
Cześć Andy, dzięki za komentarz. W winiecie dowiedziałem się, że możesz także krige bez modelu wariogramu. Zrobiłem następujące: krige (reszty ~ 1, temp_plot_spatial, y, nmin = 5, nmax = 10), więc krige tylko patrząc na minimum 5 sąsiadów i maksymalnie 10. Czy to ma w ogóle jakiś sens? Wynik był całkiem miły: dropbox.com/s/7lxvfiyfl7ekhb4/...
Kasper
Myślę, że mam problem z modelowaniem wariogramu: co jeśli założycie, że korelacja nie ma nic wspólnego z odległością, ale z najbliższymi sąsiadami?
Kasper,
„co jeśli założycie, że korelacja nie ma nic wspólnego z odległością, ale z najbliższymi sąsiadami?” - to nie kriguje, jest bardziej zgodne z klasyfikacją knn. Kod krige(residuals~1 ,temp_plot_spatial, y, nmin=5, nmax=10)szacuje lokalne wariogramy. Np. Nie masz wariogramu na całej przestrzeni do nauki, ale oszacuj nowy model dla każdej lokalizacji, którą próbujesz przewidzieć. Model lokalny następnie pobiera tylko najbliższe 10 wartości (ponieważ nie określasz maksymalnej odległości, zawsze nminpowinien pobierać 10 wartości, więc powinien być zbędny).
Andy W
1
Zatem oszacowanie lokalnych wariogramów jest logiczną rzeczą. Jeśli różnią się w zależności od niektórych funkcji, w tym innych predyktorów w modelu, jest również opcją. IDW można uznać za najprostszy typ modelu kriging - więc IDW nie powinien być lepszy niż faktyczne oszacowanie wariogramu na podstawie danych.
Andy W

Odpowiedzi:

9

Wprowadzenie i podsumowanie

Prawo TOBLER za Geografii twierdzi

Wszystko jest powiązane ze wszystkim innym, ale rzeczy bliskie są bardziej powiązane niż rzeczy odległe.

Kriging przyjmuje model tych relacji, w których

  • „Rzeczy” to wartości liczbowe w miejscach na powierzchni ziemi (lub w przestrzeni), zwykle reprezentowane jako płaszczyzna euklidesowa.

  • Przyjmuje się, że te wartości liczbowe są realizacjami zmiennych losowych.

  • „Powiązane” wyraża się w postaci średnich i kowariancji tych zmiennych losowych.

(Zbiór zmiennych losowych powiązanych z punktami w przestrzeni nazywany jest „procesem stochastycznym”) . Wariogram dostarcza informacji potrzebnych do obliczenia tych kowariancji.

Czym jest Kriging

Kriging to w szczególności przewidywanie rzeczy w miejscach, w których nie zostały zaobserwowane. Aby uczynić proces przewidywania matematycznie wykonalnym, Kriging ogranicza możliwe wzory, które są liniowymi funkcjami obserwowanych wartości. To sprawia, że ​​problem jest skończony z określania, jakie powinny być współczynniki. Można je znaleźć, wymagając, aby procedura predykcji miała określone właściwości. Intuicyjnie doskonałą właściwością jest to, że różnice między predyktorem a prawdziwą (ale nieznaną) wartością powinny być niewielkie: to znaczy predyktor powinien być precyzyjny . Kolejną właściwością, która jest wysoce reklamowana, ale jest bardziej wątpliwa, jest to, że średnio predyktor powinien być równy prawdziwej wartości: powinien być dokładny .

(Powodem, dla którego naleganie na idealną dokładność jest wątpliwe - ale niekoniecznie złe - jest to, że zwykle powoduje, że każda procedura statystyczna jest mniej precyzyjna: to znaczy bardziej zmienna. Podczas strzelania do celu wolisz równomiernie rozrzucać uderzenia wokół obrzeża i rzadko uderzają w środek, czy zaakceptowałbyś wyniki, które są skupione tuż obok, ale nie dokładnie na środku? To pierwsze jest dokładne, ale nieprecyzyjne, a drugie jest niedokładne, ale precyzyjne.)

Te założenia i kryteria - czyli środki i kowariancje są odpowiednimi sposobami do kwantyfikacji pokrewieństwa, że ​​predykcja liniowa będzie działać, a predyktor powinien być tak precyzyjny, jak to możliwe, z zastrzeżeniem doskonałej dokładności - prowadzą do układu równań, który ma unikalne rozwiązanie pod warunkiem, że kowariancje zostały określone w spójny sposób . Otrzymany predyktor jest przez to nazywany „BLUP”: Najlepszy liniowy bezstronny predyktor.

Gdzie przychodzi wariogram

Znalezienie tych równań wymaga operacjonalizacji właśnie opisanego programu. Odbywa się to poprzez zapisanie kowariancji między predyktorem a obserwacjami uważanymi za zmienne losowe. Algebra kowariancji powoduje kowariancji pomiędzy obserwowanymi wartościami wejść w równaniach kriging też.

W tym momencie dochodzimy do ślepego zaułka, ponieważ kowariancje te prawie zawsze są nieznane. W końcu w większości aplikacji zaobserwowaliśmy tylko jedną realizację każdej z losowych zmiennych: mianowicie nasz zestaw danych, który stanowi tylko jedną liczbę w każdej odrębnej lokalizacji. Wprowadź wariogram: ta funkcja matematyczna mówi nam, jaka powinna być kowariancja między dowolnymi dwoma wartościami. Ograniczone jest zapewnienie, że te kowariancje są „spójne” (w tym sensie, że nigdy nie da zestawu kowariancji, które są matematycznie niemożliwe: nie wszystkie zbiory liczbowych miar „pokrewieństwa” utworzą rzeczywiste macierze kowariancji ). Dlatego wariogram jest niezbędny dla Kriginga.

Bibliografia

Ponieważ udzielono odpowiedzi na bezpośrednie pytanie, zatrzymam się tutaj. Zainteresowani czytelnicy mogą dowiedzieć się, w jaki sposób wariogramy są szacowane i interpretowane, konsultując dobre teksty, takie jak Journel & Huijbregts ' Mining Geostatistics (1978) lub Isaaks & Srivastava's Applied Geostatistics (1989). (Należy zauważyć, że proces szacowania wprowadza dwa obiekty zwane „wariogramami”: wariogram empiryczny uzyskany z danych i dopasowany do niego wariogram modelu . Wszystkie odniesienia do „wariogramu” w tej odpowiedzi dotyczą modelu. Wezwanie do vgmpytania zwraca komputerową reprezentację wariogramu modelu.) Aby uzyskać bardziej nowoczesne podejście, w którym estymacja wariogramu i Kriginga są odpowiednio połączone, patrz Diggle &Geostatystyka oparta na modelach (2007) (która jest również rozszerzoną instrukcją dla Rpakietów GeoRi GeoRglm).


Komentarze

Nawiasem mówiąc, niezależnie od tego, czy używasz Kriginga do prognozowania, czy jakiegoś innego algorytmu, ilościowa charakterystyka pokrewieństwa zapewniona przez wariogram jest przydatna do oceny dowolnej procedury prognozowania. Zauważ, że wszystkie metody interpolacji przestrzennej są predyktorami z tego punktu widzenia - a wiele z nich to predyktory liniowe, takie jak IDW (Inverse Distance Weighted). Wariogram można wykorzystać do oceny średniej wartości i dyspersji (odchylenia standardowego) dowolnej metody interpolacji. Dzięki temu ma zastosowanie znacznie wykraczające poza jego zastosowanie w Kriging.

Whuber
źródło
Dziękuję za tę szczegółową odpowiedź. Zadaję to samo pytanie, co powyżej, a jeśli nie mogę założyć, że korelacja przestrzenna jest niezależna od lokalizacji? Czy to prawda, że ​​modelowanie wariogramu nie jest wtedy przydatne, ponieważ musiałbym zrobić model wariogramu dla wszystkich lokalizacji? Czy wtedy lepiej jest używać IDW?
Kasper,
Kiedy nie można założyć stacjonarności procesu drugiego rzędu , wówczas kilka opcji obejmuje (1) zebranie wielu realizacji procesu (gdy zmienia się on w czasie); (2) szacowanie wariogramów w lokalnych podregionach (gdy jest dużo danych); i (3) zakładając parametryczny model zmiany wariogramu wraz z lokalizacją (jak w modelach GARCH dla procesów 1D). Moje ostatnie komentarze bezpośrednio dotyczą niedopuszczalności polegania na czymś takim jak IDW: czy można oszacować wariogram, w zasadzie istnieje i dlatego IDW jest zwykle nieoptymalny.
whuber