Szukam zaleceń dotyczących najlepszych praktyk postępowania z warstwami danych rastrowych o różnych rozdzielczościach i prognozach. Porada, którą otrzymałem, to zawsze przeskalowywanie do warstwy o najniższej rozdzielczości przed wykonaniem jakiejkolwiek analizy, ale wydaje mi się to ogromną stratą precyzji i nigdy nie otrzymałem solidnego wyjaśnienia, dlaczego należy to zrobić.
Kiedy uzasadnione jest ponowne próbkowanie w celu dopasowania do siatki o wyższej rozdzielczości i jakie są implikacje w porównaniu do ponownego próbkowania do niższej rozdzielczości?
Zdaję sobie sprawę, że jest to prawdopodobnie wysoce zależne od sytuacji. Głównie szukam ogólnych wskazówek, ale oto mój konkretny scenariusz w celach informacyjnych:
Scenariusz: zamierzam zbudować model regresji przestrzennej przewidujący użytkowanie gruntów w oparciu o różnorodne warstwy środowiskowe i społeczno-gospodarcze. Moja mapa zagospodarowania przestrzennego pochodzi od Landsata i dlatego mam rozdzielczość 30m. Przykłady warstw objaśniających obejmują SRTM DEM (3 sekundy łukowe, ~ 90 m) i bioklimatyczne warstwy klimatyczne (30 sekund łukowych, ~ 1 km).
źródło
Odpowiedzi:
W rzeczywistości nie wszystko zależy od sytuacji i dotyczy wyłącznie błędu statystycznego.
Za każdym razem, gdy próbujesz ponownie do wyższej rozdzielczości, wprowadzasz fałszywą dokładność. Rozważ zestaw danych mierzonych tylko w stopach w liczbach całkowitych. Dowolny punkt może znajdować się w odległości +/- 0,5 stopy od jego rzeczywistej lokalizacji. Jeśli próbujesz ponownie do najbliższej dziesiątej, mówisz teraz, że podana liczba nie jest większa niż +/- 0,1 od jej rzeczywistej lokalizacji. Wiesz jednak, że twoje pierwotne pomiary nie były tak dokładne i teraz pracujesz w granicach błędu. Jeśli jednak pójdziesz w drugą stronę i przeskalujesz do niższej rozdzielczości, wiesz, że każda podana wartość punktowa jest zdecydowanie dokładna, ponieważ mieści się w marginesie błędu większej próbki.
Poza matematyką statystyczną pierwsze miejsce, jakie przychodzi na myśl, to geodezja. Starsze ankiety określały tylko łożyska z dokładnością do pół minuty i odległości do jednej dziesiątej stopy. Wykreślenie trawersu granicznego za pomocą tych pomiarów może często prowadzić do błędnego zamknięcia (punkt początkowy i końcowy powinny być takie same, ale nie są) mierzone w stopach. Współczesne ankiety sięgają co najmniej najbliższej sekundy i setnej części stopy. Na wartości pochodne (takie jak powierzchnia działki) może znacząco wpływać różnica precyzji. Pochodną samą wartość można również podać jako zbyt precyzyjną.
W przypadku analizy, jeśli przeskalujesz do wyższej rozdzielczości, wyniki będą oznaczały znacznie większą dokładność niż dane, na których są oparte. Rozważ swój SRTM na 90m. Niezależnie od metody pomiaru wysokości (średni / maksymalny / średni zwrot), najmniejszą jednostką (pikselem), którą można odróżnić od sąsiadów, jest 90 m. Jeśli przeskalujesz to do 30 m, albo:
Zatem w obu przypadkach wprowadzasz fałszywą dokładność, ponieważ twoje nowe podpróbki nie zostały faktycznie zmierzone.
Powiązane pytanie: Jakie praktyki są dostępne w celu modelowania przydatności gruntów?
źródło