Jak utworzyć mapę błędów w celu obsługi mapy średniej gęstości jądra?

10

Stworzyłem mapę średniej gęstości jądra, uruchamiając KDE na punktach ułożonych w tym samym zakresie przestrzennym. Załóżmy na przykład, że mamy trzypunktowe pliki kształtu reprezentujące sadzonki w trzech różnych szczelinach leśnych o tym samym kształcie i wielkości. Uruchomiłem KDE dla każdego pliku kształtu. Wyjście z KDE zostały następnie ułożone na podstawie zakresu przestrzennego w celu obliczenia średniej w Arc kalkulatora rastrowych, np Float(("KDE1"+"KDE2"+"KDE3")/3). Oto produkt końcowy:

wprowadź opis zdjęcia tutaj

Teraz jestem zainteresowany stworzeniem mapy przedstawiającej błąd związany ze uśrednionymi KDE. Mam nadzieję, że użyję mapy błędów, aby wizualnie zobrazować, ile błędów jest związanych z punktami dostępowymi (np. Czy punkt dostępowy SW wynika wyłącznie z punktów w jednej szczelinie?). Jak powinienem zacząć tworzyć mapę błędu związanego ze uśrednionymi KDE? Czy MSE byłby najbardziej odpowiednią miarą błędu w tym przypadku?

Aaron
źródło
3
To bardzo interesująca analiza. Co rozumiesz przez „błąd standardowy”? Jakieś odchylenie (różnica) każdej mapy gęstości od „średniej” warstwy?
Analiza krajobrazu
@ Analiza krajobrazu Post edytowany w celu dostosowania komentarzy. Tak, myślę, że oszacowanie MSE może być najbardziej odpowiednie w tym przypadku. Zasadniczo pokazując, jak każde KDE odbiega od przeciętnego KDE. Nie jestem jednak pewien, jak to wszystko połączyć za pomocą ArcGIS i / lub skryptów.
Aaron

Odpowiedzi:

8

Zastrzeżenie

Błąd standardowy jest użytecznym sposobem oszacowania niepewności na podstawie próbkowanych danych, gdy nie ma błędu systematycznego w danych. To założenie jest wątpliwe w tym kontekście, ponieważ (a) mapy KDE będą lokalnie mieć określone błędy, które mogą systematycznie utrzymywać się między warstwami oraz (b) potencjalnie ogromny składnik niepewności z powodu wyboru promienia jądra (lub „szerokości pasma”) „) w ogóle nie znajdzie odzwierciedlenia w żadnej kolekcji tych map.

Niektóre wybory

Niemniej jednak przedstawienie zmienności wśród zbioru powiązanych, skolokowanych („ułożonych”) map jest świetnym pomysłem - pod warunkiem, że pamiętasz opisane ograniczenia. W tym otoczeniu naturalne byłoby kilka miar lokalnej zmienności, w tym:

  • Zakres wartości, wyrażone addytywnie (maksymalna minus minimalna) lub multiplikatywnie (maksymalnie podzielone przez minimum).

  • Wariancji lub odchylenie standardowe wartości. Mnożącą wersją tego byłoby wariancja lub odchylenie standardowe logarytmów wartości.

  • Solidny estymator dyspersji, taki jak zakres międzykwartylowy (lub stosunek trzeciego do pierwszego kwartylu).

Pod wieloma względami miary multiplikacyjne mogą być bardziej odpowiednie dla gęstości, ponieważ różnica między (powiedzmy) 100 a 101 drzew na akr może być nieistotna, podczas gdy różnica między 2 a 1 drzewem na akr może być stosunkowo ważna. Oba wykazują ten sam (addytywny) zakres 101 - 100 = 2 - 1 = 1, ale ich multiplikatywne zakresy 1,01 i 2,00 różnią się znacznie. (Zwróć uwagę, że zakres multiplikatywny zawsze przekracza 1, więc 2,00 jest sto razy dalej od 1 niż 1,01).

Obliczenie

Obliczenie tych miar wymaga pewnej formy lokalnych statystyk. Funkcja statystyki komórki w programie Spatial Analyst oblicza wariancje, zakresy i odchylenia standardowe. Lokalne kwantyle można znaleźć według rangi . Zamiast być wybrednym w kwestii tego, które szeregi użyć, wybierz wygodne w pobliżu kwartyli. Aby je znaleźć, niech n będzie liczbą siatek na stosie. Mediana ma rangę (n + 1) / 2 - która może nie być liczbą całkowitą, co oznacza, że ​​należy ją obliczyć przez uśrednienie rang n / 2 i n / 2 + 1, z których każda byłaby zbliżona do mediany. Aby przybliżyć kwartyle, zaokrąglij (n + 1) / 2 w dół do najbliższej liczby całkowitej, następnie ponownie dodaj 1 i podziel przez 2. Niech ta liczba będzie r . Posługiwać sięr i n + 1 - r dla szeregów kwartyli.

Na przykład, jeśli stos ma n = 6 siatek, (n + 1) / 2 zaokrąglone w dół to 3, a (3 + 1) / 2 = 2 nie wymaga zaokrąglania. Dla rang użyj r = 2 i r = 6 + 1 - 2 = 5. W efekcie ta procedura zwróciłaby drugą najniższą ( r = 2) i drugą najwyższą ( r = 5) wartość z sześciu wartości w każdej komórce. Możesz zmapować ich różnicę lub stosunek.

Whuber
źródło
2
Wyobrażam sobie, że współczynnik zmienności byłby przydatny w tym kontekście.
Jeffrey Evans
1
@ jeffrey Dziękuję, to także uwaga. CV uzyskuje się poprzez podzielenie (lokalnej) siatki odchyleń standardowych przez (lokalną) średnią siatkę. Nie wspomniałem o tym, ale w przypadku takich multiplikatywnych podsumowań należy zachować ostrożność, aby zamaskować obszary, w których mianownik (w zależności od przypadku średnia lub minimalna) jest bliski zeru: wyniki mogą być niewiarygodne i prawdopodobne nie odzwierciedlą niczego poza nieprecyzyjnością liczbową i drobnymi niedokładnościami w przybliżeniu jąder.
whuber
@ Whuber, czy mógłbyś rozwinąć kwestię (a) w swoim pierwszym akapicie? Na przykład, czy masz na myśli błędy w technikach gromadzenia danych, które mogą utrzymywać się w obrębie każdej luki leśnej (a zatem systematycznie objawiają się w każdym rastrze KDE), czy błędy związane z implementacją funkcji ogniskowej?
MannyG
@whuber Świetne pomysły dookoła - wielkie dzięki!
Aaron