Pracuję nad problemem, w którym muszę użyć Kriginga, aby przewidzieć wartość niektórych zmiennych na podstawie otaczających zmiennych. Chcę sam wdrożyć jego kod. Przejrzałem zbyt wiele dokumentów, aby zrozumieć, jak to działa, ale byłem bardzo zdezorientowany. Ogólnie rozumiem, że jest to średnia ważona, ale nie mogłem całkowicie zrozumieć procesu obliczania masy, a następnie przewidzieć wartość zmiennej.
Czy ktoś może mi wyjaśnić w prosty sposób matematyczne aspekty tych metod interpolacji i jak to działa?
spatial
interpolation
kriging
Dania
źródło
źródło
Odpowiedzi:
Ta odpowiedź składa się z części wprowadzającej, którą napisałem niedawno dla artykułu opisującego (skromne) przestrzenno-czasowe rozszerzenie „Universal Kriging” (Wielka Brytania), które samo w sobie jest skromnym uogólnieniem „Zwykłego krigingu”. Ma trzy podsekcje: Teoria podaje model statystyczny i założenia; Oszacowanie krótko przegląda oszacowanie parametru metodą najmniejszych kwadratów; a Prognozowanie pokazuje, jak kriging pasuje do frameworku uogólnionych obiektów najmniejszych (GLS). Dołożyłem starań, aby przyjąć notację znaną statystykom, zwłaszcza odwiedzającym tę stronę, i użyć pojęć, które są tutaj dobrze wyjaśnione.
Podsumowując, kriging jest najlepszą liniową bezstronną prognozą (BLUP) losowego pola. Oznacza to, że przewidywana wartość w dowolnym niespróbkowanym miejscu jest uzyskiwana jako liniowa kombinacja wartości i zmiennych towarzyszących obserwowanych w próbkowanych miejscach. (Nieznana, losowa) wartość ma tam założoną korelację z wartościami próbek (a wartości próbek są skorelowane między sobą). Ta informacja o korelacji łatwo przekłada się na wariancję prognozy. Wybrano współczynniki w kombinacji liniowej („masy kriginga”), które sprawiają, że ta wariancja jest tak mała, jak to możliwe, z zastrzeżeniem warunku zerowego odchylenia w prognozie. Szczegóły podano poniżej.
Teoria
Wielka Brytania obejmuje dwie procedury - jedną szacunkową, a drugą prognozową - przeprowadzoną w kontekście modelu GLS dla badanego obszaru. Modelowe GLS zakłada, że próbki danych jest wynikiem przypadkowych odchylenia wokół trendu i że te odchylenia są skorelowane. Trend rozumiany jest w ogólnym znaczeniu wartości, którą można określić przez liniową kombinację p nieznanych współczynników (parametrów) β = ( β 1 , β 2 , … , βzja, ( I = 1 , 2 , . . . , N ) p . (W całym tym stanowiskiem, pierwsza " oznacza macierzy przeniesienia i wszystkie wektory uważa się wektory kolumny).β=(β1,β2,…,βp)′ ′
W dowolnym miejscu w obszarze badań dostępna jest krotka atrybutów liczbowych zwanych „zmiennymi niezależnymi” lub „zmiennymi towarzyszącymi”. (Zazwyczaj y 1 = 1 jest „ składnikiem stałym”, y 2 i y 3 mogą być współrzędnymi przestrzennymi, a dodatkowe y iy=(y1,y2,…,yp)′ y1=1 y2 y3 yi może reprezentować informacje przestrzenne, a także inne informacje pomocnicze, które są dostępne we wszystkich lokalizacjach na badanym obszarze, takie jak porowatość warstwy wodonośnej lub odległość do studni pompującej.) W każdym miejscu danych oprócz zmiennych towarzyszących y i = ( y i 1 , y i 2 , … , y i p ) ′ , powiązana obserwacja z i jest uważana za realizację zmiennej losowej Z i . Natomiast y ii yi=(yi1,yi2,…,yip)′ zi Zi yi są uważane za wartości określone przez lub charakteryzujące punkty lub małe regiony reprezentowane przez obserwacje (dane „wspierają”). nie są uważane za realizacje zmiennych losowych oraz muszą być związane z własnościami z któregokolwiek z Z I .yi Zi
Kombinacja liniowa wyraża oczekiwaną wartość Z i w kategoriach parametrów β , czyli wartość trendu w lokalizacji i . Proces szacowania wykorzystuje dane, aby znaleźć wartości p I , które stanowią nieznane parametry p I
Oszacowanie
Prognoza
(Czytelnicy zaznajomieni z regresją wielokrotną mogą uznać za pouczające porównanie tego rozwiązania z rozwiązaniem kowariancji zwykłych równań zwykłych najmniejszych kwadratów , które wygląda prawie dokładnie tak samo, ale bez wyrażeń Lagrange'a.)
źródło