Jak działa interpolacja Kriging?

10

Pracuję nad problemem, w którym muszę użyć Kriginga, aby przewidzieć wartość niektórych zmiennych na podstawie otaczających zmiennych. Chcę sam wdrożyć jego kod. Przejrzałem zbyt wiele dokumentów, aby zrozumieć, jak to działa, ale byłem bardzo zdezorientowany. Ogólnie rozumiem, że jest to średnia ważona, ale nie mogłem całkowicie zrozumieć procesu obliczania masy, a następnie przewidzieć wartość zmiennej.

Czy ktoś może mi wyjaśnić w prosty sposób matematyczne aspekty tych metod interpolacji i jak to działa?

Dania
źródło
3
Wdrażanie kodu jest doskonałym narzędziem do nauki, ale nie może być zalecane do pracy nad rzeczywistymi problemami. Do czasu, gdy kod zostanie napisany, debugowany i przetestowany, odkryjesz, że wymaga on rzędu wielkości wysiłku, aby zapewnić dodatkowe narzędzia do analizy danych z eksploracyjnych badań przestrzennych, wariografii, walidacji krzyżowej wariogramu, przeszukiwania sąsiedztwa i post- przetwarzanie wyników kriged. Rozsądnym i skutecznym kompromisem byłoby zacząć od działającego kodu, takiego jak GSLib lub GeoRGLM , i zmodyfikować go.
whuber
Wielkie dzięki, to świetny pomysł, ale chcę również zrozumieć matematyczny aspekt Kriging, czy masz zasób, który wyjaśnia to w prosty sposób? Dziękuję Ci.
Dania

Odpowiedzi:

15

Ta odpowiedź składa się z części wprowadzającej, którą napisałem niedawno dla artykułu opisującego (skromne) przestrzenno-czasowe rozszerzenie „Universal Kriging” (Wielka Brytania), które samo w sobie jest skromnym uogólnieniem „Zwykłego krigingu”. Ma trzy podsekcje: Teoria podaje model statystyczny i założenia; Oszacowanie krótko przegląda oszacowanie parametru metodą najmniejszych kwadratów; a Prognozowanie pokazuje, jak kriging pasuje do frameworku uogólnionych obiektów najmniejszych (GLS). Dołożyłem starań, aby przyjąć notację znaną statystykom, zwłaszcza odwiedzającym tę stronę, i użyć pojęć, które są tutaj dobrze wyjaśnione.

Podsumowując, kriging jest najlepszą liniową bezstronną prognozą (BLUP) losowego pola. Oznacza to, że przewidywana wartość w dowolnym niespróbkowanym miejscu jest uzyskiwana jako liniowa kombinacja wartości i zmiennych towarzyszących obserwowanych w próbkowanych miejscach. (Nieznana, losowa) wartość ma tam założoną korelację z wartościami próbek (a wartości próbek są skorelowane między sobą). Ta informacja o korelacji łatwo przekłada się na wariancję prognozy. Wybrano współczynniki w kombinacji liniowej („masy kriginga”), które sprawiają, że ta wariancja jest tak mała, jak to możliwe, z zastrzeżeniem warunku zerowego odchylenia w prognozie. Szczegóły podano poniżej.


Teoria

Wielka Brytania obejmuje dwie procedury - jedną szacunkową, a drugą prognozową - przeprowadzoną w kontekście modelu GLS dla badanego obszaru. Modelowe GLS zakłada, że próbki danych jest wynikiem przypadkowych odchylenia wokół trendu i że te odchylenia są skorelowane. Trend rozumiany jest w ogólnym znaczeniu wartości, którą można określić przez liniową kombinację p nieznanych współczynników (parametrów) β = ( β 1 , β 2 , , βzi, (i=1,2,...,n)p . (W całym tym stanowiskiem, pierwsza " oznacza macierzy przeniesienia i wszystkie wektory uważa się wektory kolumny).β=(β1,β2,,βp)

W dowolnym miejscu w obszarze badań dostępna jest krotka atrybutów liczbowych zwanych „zmiennymi niezależnymi” lub „zmiennymi towarzyszącymi”. (Zazwyczaj y 1 = 1 jest „ składnikiem stałym”, y 2 i y 3 mogą być współrzędnymi przestrzennymi, a dodatkowe y iy=(y1,y2,,yp)y1=1y2y3yimoże reprezentować informacje przestrzenne, a także inne informacje pomocnicze, które są dostępne we wszystkich lokalizacjach na badanym obszarze, takie jak porowatość warstwy wodonośnej lub odległość do studni pompującej.) W każdym miejscu danych oprócz zmiennych towarzyszących y i = ( y i 1 , y i 2 , , y i p ) , powiązana obserwacja z i jest uważana za realizację zmiennej losowej Z i . Natomiast y iiyi=(yi1,yi2,,yip)ziZiyisą uważane za wartości określone przez lub charakteryzujące punkty lub małe regiony reprezentowane przez obserwacje (dane „wspierają”). nie są uważane za realizacje zmiennych losowych oraz muszą być związane z własnościami z któregokolwiek z Z I .yiZi

Kombinacja liniowa wyraża oczekiwaną wartość Z i w kategoriach parametrów β , czyli wartość trendu w lokalizacji i . Proces szacowania wykorzystuje dane, aby znaleźć wartości p I , które stanowią nieznane parametry p I

E[Zi]=yiβ=yi1β1+yi2β2++yipβp
Ziβiβ^iβi, podczas gdy proces prognozowania wykorzystuje dane w lokalizacjach do obliczenia wartości w niespróbkowanej lokalizacji, która jest tutaj indeksowana jako i = 0 . Cele estymacji są stałymi ( tj. Nieprzypadkowymi) parametrami, podczas gdy cel predykcji jest losowy, ponieważ wartość z 0 obejmuje losową fluktuację wokół jej trendu y 0 β . Zazwyczaj prognozy są tworzone dla wielu lokalizacji korzystających z tych samych danych, zmieniając lokalizację 0i=1,2,,ni=0z0y0β0. Na przykład często wykonuje się prognozy, aby wyznaczyć powierzchnię wzdłuż regularnej siatki punktów odpowiednich do konturowania.

Oszacowanie

ZiZiZjcij

β^=Hz, H=(YC1Y)1YC1
z=(z1,z2,,zn)nY=(yij)npyi,1inC=(cij)nnpnHzβ^β^C=(cij)

Prognoza

z0

z^0=λ1z1+λ2z2++λnzn=λz.
λiz0z0ZiZ0
0=E[Z^0Z0]=E[λZZ0].
n+1Z0Z=(Z1,Z2,,Zn)
0=E[λZZ0]=λE[Z]E[Z0]=λ(Yβ)y0β=(λYy0)β=β(Yλy0)

β

Y^λ=y0.

λZ^0Z0

Var(Z^0Z0)=E[(Z^0Z0)2]=E[(λZZ0)2]=c002λc0+λCλ
c0=(c01,c02,,c0n)Z0Zi, i1c00Z0

λpμY^λ=y0n+p

(CYY0)(λμ)=(c0y0)
0pp1nnλ
λ=Hy0+C1(1YH)c0.

(Czytelnicy zaznajomieni z regresją wielokrotną mogą uznać za pouczające porównanie tego rozwiązania z rozwiązaniem kowariancji zwykłych równań zwykłych najmniejszych kwadratów , które wygląda prawie dokładnie tak samo, ale bez wyrażeń Lagrange'a.)

λ[Hy0]Z0z^0

Whuber
źródło
1
Dziękuję bardzo, kurwa, właśnie tego szukam. Rozwiązałeś dla mnie ten problem, teraz rozumiem Kriginga. Naprawdę doceniam twoją pomoc, wielkie dzięki.
Dania
Y^
Y=(yji)pnyi,1in