Jestem zupełnie nowy w statystyce przestrzennej i oglądam wiele samouczków,
Ale tak naprawdę nie rozumiem, dlaczego musisz dostarczyć model wariogramu, kiedy krige.
Korzystam z pakietu gstat w R, a oto przykład, który dają:
library(sp)
data(meuse)
coordinates(meuse) = ~x+y
data(meuse.grid)
str(meuse.grid)
gridded(meuse.grid) = ~x+y
m <- vgm(.59, "Sph", 874, .04)
print(m)
# ordinary kriging:
x <- krige(log(zinc)~1, meuse, meuse.grid, model = m)
Czy ktoś jest w stanie wyjaśnić w kilku wierszach, dlaczego najpierw musisz dostarczyć vgm? A jak ustawić parametry?
Z góry dziękuję! Kasper
gstat
pakietu R tych samych danych muse.krige(residuals~1 ,temp_plot_spatial, y, nmin=5, nmax=10)
szacuje lokalne wariogramy. Np. Nie masz wariogramu na całej przestrzeni do nauki, ale oszacuj nowy model dla każdej lokalizacji, którą próbujesz przewidzieć. Model lokalny następnie pobiera tylko najbliższe 10 wartości (ponieważ nie określasz maksymalnej odległości, zawszenmin
powinien pobierać 10 wartości, więc powinien być zbędny).Odpowiedzi:
Wprowadzenie i podsumowanie
Prawo TOBLER za Geografii twierdzi
Kriging przyjmuje model tych relacji, w których
„Rzeczy” to wartości liczbowe w miejscach na powierzchni ziemi (lub w przestrzeni), zwykle reprezentowane jako płaszczyzna euklidesowa.
Przyjmuje się, że te wartości liczbowe są realizacjami zmiennych losowych.
„Powiązane” wyraża się w postaci średnich i kowariancji tych zmiennych losowych.
(Zbiór zmiennych losowych powiązanych z punktami w przestrzeni nazywany jest „procesem stochastycznym”) . Wariogram dostarcza informacji potrzebnych do obliczenia tych kowariancji.
Czym jest Kriging
Kriging to w szczególności przewidywanie rzeczy w miejscach, w których nie zostały zaobserwowane. Aby uczynić proces przewidywania matematycznie wykonalnym, Kriging ogranicza możliwe wzory, które są liniowymi funkcjami obserwowanych wartości. To sprawia, że problem jest skończony z określania, jakie powinny być współczynniki. Można je znaleźć, wymagając, aby procedura predykcji miała określone właściwości. Intuicyjnie doskonałą właściwością jest to, że różnice między predyktorem a prawdziwą (ale nieznaną) wartością powinny być niewielkie: to znaczy predyktor powinien być precyzyjny . Kolejną właściwością, która jest wysoce reklamowana, ale jest bardziej wątpliwa, jest to, że średnio predyktor powinien być równy prawdziwej wartości: powinien być dokładny .
(Powodem, dla którego naleganie na idealną dokładność jest wątpliwe - ale niekoniecznie złe - jest to, że zwykle powoduje, że każda procedura statystyczna jest mniej precyzyjna: to znaczy bardziej zmienna. Podczas strzelania do celu wolisz równomiernie rozrzucać uderzenia wokół obrzeża i rzadko uderzają w środek, czy zaakceptowałbyś wyniki, które są skupione tuż obok, ale nie dokładnie na środku? To pierwsze jest dokładne, ale nieprecyzyjne, a drugie jest niedokładne, ale precyzyjne.)
Te założenia i kryteria - czyli środki i kowariancje są odpowiednimi sposobami do kwantyfikacji pokrewieństwa, że predykcja liniowa będzie działać, a predyktor powinien być tak precyzyjny, jak to możliwe, z zastrzeżeniem doskonałej dokładności - prowadzą do układu równań, który ma unikalne rozwiązanie pod warunkiem, że kowariancje zostały określone w spójny sposób . Otrzymany predyktor jest przez to nazywany „BLUP”: Najlepszy liniowy bezstronny predyktor.
Gdzie przychodzi wariogram
Znalezienie tych równań wymaga operacjonalizacji właśnie opisanego programu. Odbywa się to poprzez zapisanie kowariancji między predyktorem a obserwacjami uważanymi za zmienne losowe. Algebra kowariancji powoduje kowariancji pomiędzy obserwowanymi wartościami wejść w równaniach kriging też.
W tym momencie dochodzimy do ślepego zaułka, ponieważ kowariancje te prawie zawsze są nieznane. W końcu w większości aplikacji zaobserwowaliśmy tylko jedną realizację każdej z losowych zmiennych: mianowicie nasz zestaw danych, który stanowi tylko jedną liczbę w każdej odrębnej lokalizacji. Wprowadź wariogram: ta funkcja matematyczna mówi nam, jaka powinna być kowariancja między dowolnymi dwoma wartościami. Ograniczone jest zapewnienie, że te kowariancje są „spójne” (w tym sensie, że nigdy nie da zestawu kowariancji, które są matematycznie niemożliwe: nie wszystkie zbiory liczbowych miar „pokrewieństwa” utworzą rzeczywiste macierze kowariancji ). Dlatego wariogram jest niezbędny dla Kriginga.
Bibliografia
Ponieważ udzielono odpowiedzi na bezpośrednie pytanie, zatrzymam się tutaj. Zainteresowani czytelnicy mogą dowiedzieć się, w jaki sposób wariogramy są szacowane i interpretowane, konsultując dobre teksty, takie jak Journel & Huijbregts ' Mining Geostatistics (1978) lub Isaaks & Srivastava's Applied Geostatistics (1989). (Należy zauważyć, że proces szacowania wprowadza dwa obiekty zwane „wariogramami”: wariogram empiryczny uzyskany z danych i dopasowany do niego wariogram modelu . Wszystkie odniesienia do „wariogramu” w tej odpowiedzi dotyczą modelu. Wezwanie do
vgm
pytania zwraca komputerową reprezentację wariogramu modelu.) Aby uzyskać bardziej nowoczesne podejście, w którym estymacja wariogramu i Kriginga są odpowiednio połączone, patrz Diggle &Geostatystyka oparta na modelach (2007) (która jest również rozszerzoną instrukcją dlaR
pakietówGeoR
iGeoRglm
).Komentarze
Nawiasem mówiąc, niezależnie od tego, czy używasz Kriginga do prognozowania, czy jakiegoś innego algorytmu, ilościowa charakterystyka pokrewieństwa zapewniona przez wariogram jest przydatna do oceny dowolnej procedury prognozowania. Zauważ, że wszystkie metody interpolacji przestrzennej są predyktorami z tego punktu widzenia - a wiele z nich to predyktory liniowe, takie jak IDW (Inverse Distance Weighted). Wariogram można wykorzystać do oceny średniej wartości i dyspersji (odchylenia standardowego) dowolnej metody interpolacji. Dzięki temu ma zastosowanie znacznie wykraczające poza jego zastosowanie w Kriging.
źródło