Zamieszanie związane z krigingiem

9

Czytałem ten artykuł na Wikipedii związany z krigingiem. Nie zrozumiałem tej części, kiedy to mówi

Kriging oblicza najlepszy liniowy estymator bezstronny, , z taki sposób, że wariancja kriginga jest minimalizowana wraz z warunkiem bezstronności. Nie otrzymałem pochodnej, a także jak zminimalizować wariancję. Jakieś sugestie?Z^(x0)Z(x0)

Szczególnie nie dostałem części, w której stosuje się zminimalizowane z zastrzeżeniem warunku bezstronności.

Myślę, że tak powinno być

E [Z '(x0) -Z (x0)] zamiast E [Z' (x) -Z (x)] prawda? ”jest równoważne kapeluszowi w artykule na wiki. Nie zrozumiałem też, w jaki sposób powstaje błąd krigingu

użytkownik31820
źródło
Gdzie się rozłączyłeś?
whuber
Część, w której oblicza błąd krigingu i narzuca warunek bezstronności. Można powiedzieć, że obiektywny warunek oznacza oczekiwanie estymatora, a prawdziwy jest równy. Zredagowałem post, aby uwzględnić szczegóły.
user31820,
Myślę, że masz rację, że wyrażenie Wikipedii powinno brzmieć . E[Z(x0)Z(x0)]
whuber

Odpowiedzi:

13

Załóżmy, że jest wektorem przyjmującym rozkład wielu zmiennych o nieznanej średniej i znanej macierzy wariancji-kowariancji . Obserwujemy z tego rozkładu i chcemy przewidzieć podstawie tych informacji za pomocą obiektywnego predyktora liniowego:(Z0,Z1,,Zn)(μ,μ,,μ)Σ(z1,z2,,zn) z0

  • Liniowy oznacza, że ​​predykcja musi przyjąć postać aby współczynniki . Współczynniki te mogą zależeć co najwyżej od tego, co wiadomo z góry: mianowicie od wpisów .z0^=λ1z1+λ2z2++λnznλiΣ

Ten predyktor można również uznać za zmienną losową .Z0^=λ1Z1+λ2Z2++λnZn

  • Bezstronna oznacza, że ​​oczekiwanie na jest równe jego (nieznanej) średniej .Z0^μ

Zapisywanie rzeczy daje pewne informacje na temat współczynników:

μ=E[Z0^]=E[λ1Z1+λ2Z2++λnZn]=λ1E[Z1]+λ2E[Z2]++λnE[Zn]=λ1μ++λnμ=(λ1++λn)μ.

Druga linia wynika z liniowości oczekiwań, a cała reszta to prosta algebra. Ponieważ ta procedura ma działać niezależnie od wartości , najwyraźniej współczynniki muszą się sumować do jedności. Zapisując współczynniki w notacji wektorowej , można to starannie zapisać .μλ=(λi)1λ=1

Wśród zestawu wszystkich takich obiektywnych predyktorów liniowych szukamy takiego, który odbiega jak najmniej od rzeczywistej wartości , mierzonej w średniej kwadratowej pomieszczenia. To znowu jest obliczenie. Opiera się na dwuliniowości i symetrii kowariancji, której zastosowanie jest odpowiedzialne za sumowania w drugim wierszu:

mi[(Z0^-Z0)2)]=mi[(λ1Z1+λ2)Z2)++λnZn-Z0)2)]=ja=1njot=1nλjaλjotvar[Zja,Zjot]-2)ja=1nλjavar[Zja,Z0]+var[Z0,Z0]=ja=1njot=1nλjaλjotΣja,jot-2)ja=1nλjaΣ0,ja+Σ0,0.

Stąd współczynniki można uzyskać, minimalizując tę ​​kwadratową postać z zastrzeżeniem (liniowego) ograniczenia . Można to łatwo rozwiązać za pomocą metody mnożników Lagrange'a, uzyskując liniowy układ równań, „równania Kriginga”.1λ=1

W aplikacji jest przestrzennym procesem stochastycznym („pole losowe”). Oznacza to, że dla dowolnego zestawu ustalonych (nieprzypadkowych) lokalizacji wektor wartości w tych lokalizacjach, jest losowy z pewnego rodzaju rozkładem wielu zmiennych. Napisz i zastosuj analizę, zakładając , że środki procesu we wszystkich lokalizacjach są takie same i przyjmując macierz kowariancji wartości procesów dla tych lokalizacje są znane z pewnością.Zx0,,xnZ(Z(x0),,Z(xn))Zja=Z(xja)n+1xjan+1

Zinterpretujmy to. Zgodnie z założeniami (w tym stałą średnią i znaną kowariancją) współczynniki określają minimalną wariancję możliwą do uzyskania przez dowolny estymator liniowy. Nazwijmy tę wariancję („OK” oznacza „zwykłe kriging”). To zależy wyłącznie od matrycy . Mówi nam, że jeśli mielibyśmy wielokrotnie próbkować od i użyć tych współczynników do przewidywania wartości na podstawie pozostałych wartości za każdym razem, toσOK.2)Σ(Z0,,Zn)z0

  1. Średnio nasze prognozy byłyby prawidłowe.

  2. Zazwyczaj nasze przewidywania dotyczące odbiegałyby od od rzeczywistych wartości .z0σOK.z0

O wiele więcej należy powiedzieć, zanim można to zastosować w praktycznych sytuacjach, takich jak oszacowanie powierzchni na podstawie danych punktowych: potrzebujemy dodatkowych założeń dotyczących tego, w jaki sposób statystyczna charakterystyka procesu przestrzennego zmienia się w zależności od miejsca i od jednej realizacji do drugiej (chociaż , w praktyce zazwyczaj dostępna będzie tylko jedna realizacja). Ale ta ekspozycja powinna wystarczyć, aby śledzić, w jaki sposób poszukiwanie „Najlepszego” bezstronnego predyktora liniowego („BLUP”) prowadzi wprost do układu równań liniowych.


Nawiasem mówiąc, kriging jak zwykle praktykowany nie jest dokładnie taki sam jak estymacja najmniejszych kwadratów, ponieważ jest szacowana w procedurze wstępnej (znanej jako „wariografia”) przy użyciu tych samych danych. Jest to sprzeczne z założeniami tego wyprowadzenia, które zakładały, że była znana (a tym bardziej niezależna od danych). Tak więc na samym początku kriging ma pewne wady koncepcyjne i statystyczne. Przemyślani praktykujący zawsze byli tego świadomi i znaleźli różne twórcze sposoby (próby) uzasadnienia niespójności. (Posiadanie dużej ilości danych może naprawdę pomóc.) Istnieją teraz procedury jednoczesnego szacowaniaΣΣΣi przewidywanie zbioru wartości w nieznanych lokalizacjach. Wymagają nieco silniejszych założeń (normalność wielowymiarowa), aby osiągnąć ten wyczyn.

Whuber
źródło
Istnieje strona internetowa, na której faceci walczą przeciwko krigingowi i wygląda na to, że ma kilka ważnych punktów. Myślę, że twój ostatni akapit jest bardzo pouczający.
Wayne
@Wayne Tak, możesz powiedzieć, na co reaguję. Ale chociaż konsultanci używali krigingu jako „oleju węża”, ma wiele do zrobienia, w tym teorię „zmiany wsparcia” w celu porównania danych uzyskanych (powiedzmy) z małych próbek nośnika z danymi uzyskanymi z dużo większych części tego medium. Kriging jest obecnie najbardziej zaawansowanym modelowaniem przestrzenno-czasowym. Jest to również przydatny sposób oceny alternatywnych propozycji: np. Wiele interpolatorów przestrzennych jest liniowych (lub można je zlinearyzować), więc sprawiedliwe jest porównanie ich wariancji oszacowania z wariancją krigingu.
whuber
1

Kriging to po prostu oszacowanie metodą najmniejszych kwadratów dla danych przestrzennych. Jako taki zapewnia liniowy obiektywny estymator, który minimalizuje sumę błędów kwadratu. Ponieważ jest bezstronna, MSE = wariancja estymatora i jest minimalna.

Michael R. Chernick
źródło
Nie dostałem części obliczającej błąd krigingu, a także mylę się z wariancją kriginga i wariancją. Jaka jest różnica i jakie jest ich znaczenie
user31820
@whuber. Dzięki za wyjaśnienie, ale nie otrzymałem wyprowadzenia równania, gdy obliczyłeś MSE wartości przewidywanej przez obiektywne oszacowanie i prawdziwy estymator. Druga linia, która ma być specyficzna w tym równaniu
użytkownik31820,
@whuber Również nie dostałem części wiki, która oblicza wariancję kriging, która jest podobna do tej w twojej odpowiedzi. Mają takie same wyniki, ale początkowe warunki są różne. Dlaczego?
user31820,