Jak porównać dwie mapy, aby ustalić, która z nich jest lepsza?

10

Próbuję dokonać obiektywnego porównania dwóch różnych map dla tego samego regionu. W tej chwili mam problemy ze zdefiniowaniem kryteriów, które pozwolą mi dokonać beznamiętnej oceny.

Czy ktoś ma jakieś pomysły, jak to zrobić lub jak podejść do problemu?

Jak widać, żadna mapa nie jest lepsza, kilka luk w niebieskim zestawie, kilka w czerwonym.

wprowadź opis zdjęcia tutaj

Styp
źródło
7
Pytanie jest bardzo źle zdefiniowane? Co rozumiesz przez jakość? Czy są jakieś domniemania dotyczące kompletności, dokładności, geometrii ...? Czy istnieje trzeci referencyjny zestaw danych do porównania?
petzlux
Tylko myśl, dlaczego nie porównać ich za pomocą zdjęć lotniczych w wysokiej rozdzielczości? Może nawet przekonwertuje je na KML i oceni ich dokładność w Google Earth.
Aaron
2
@Martin, Czy pytasz o metodę wyróżnienia różnic geometrycznych dwóch warstw?
grafika 21
1
Na ten temat jest dużo literatury. Kilka dokumentów na dobry
underdark
1
Czy to pytanie nie ma tak naprawdę wiele wspólnego z kartografią lub mapami, ale raczej z jakością danych? Być może mógłbyś przeformułować swoje pytanie i zapewnić większy kontekst po stronie jakości danych.
blah238

Odpowiedzi:

14

Ta odpowiedź opisuje obiektywną metodę pomiaru arbitralnych rozbieżności między dwoma zbiorami danych przestrzennych. Takie rozbieżności mogą obejmować przesunięcia pozycji, zmiany kształtu i cechy obecne w jednym zbiorze danych, ale nie w innym. Ta odpowiedź nie zapewnia żadnego sposobu ustalenia, który „lepszy”, ponieważ zależy to znacznie więcej niż tylko od danych, a szczególnie od tego, do czego dane będą wykorzystane.

tło

Dobra podstawa dla dużego zestawu takich pomiarów opiera się na euklidesowej transformacji odległości każdego zestawu danych. Spowoduje to wyświetlenie każdego zestawu danych jako reprezentującego zbiór punktów na płaszczyźnie. Nazwijmy te kolekcje B dla niebieskich elementów i R dla czerwonych elementów.

Dla dowolnego punktu x w płaszczyźnie, odległość euklidesowa przekształcić zestaw punktu oblicza największą dolna granica odległości pomiędzy X i A . Możemy myśleć o tym, jak przekształcać tworząc „powierzchni”, którego wysokość w X równa najkrótszej odległości od X do A . W ten sposób powierzchnia ta ma doliny w każdym punkcie A , gdzie jego wysokość jest równa zero, a wznosi się w stosunku 1: 1 z dala od nachylenia A . Oczywiste jest, że transformacja odległości z kolei określa A (lub technicznie jej metryczne zamknięcie , które dla zestawów danych GIS jest takie samo jak A) jako zbiór wszystkich punktów na wysokości zero. Zatem transformacja odległości całkowicie przechwytuje wszystkie informacje przestrzenne A, które GIS może reprezentować.

Rycina 1

Ta rycina pokazuje transformaty odległości B (po lewej) i R (po prawej) w pseudo-reliefie.

Porównywanie dwóch zestawów danych

Aby porównać B i R , nałóż na siebie transformatę odległościową drugiej:

Rysunek 2

Wartości odległości są wyświetlane jako kolory stopniowane od niebieskiego (blisko 0) do czerwonego.

Lewe mapa, na przykład, pokazuje punkty B i kolory zgodnie z ich odległości od R . Role B i R zostały przełączone na właściwej mapie.

Już teraz pomagają one w dokonywaniu porównań: każda mapa pokazuje punkty jednego zestawu danych i, używając koloru, podkreśla punkty, które są dalekie od dowolnego punktu w drugim zestawie danych. Zauważ, że obie mapy są potrzebne do porównania, ponieważ każda pokazuje punkty nie na drugiej.

Na szczegółowych mapach kolor może być trudny do zobaczenia, więc możemy go nieco rozmyć w celu prezentacji lub oceny wizualnej:

Rycina 3

Uwaga: Kolory nie są porównywalne między dwiema mapami: w obrębie każdej mapy są one skalowane, aby pokazać pełny zakres odległości na tej mapie.

Analiza statystyczna różnic

Piękno tego podejścia polega na tym, co można zrobić w przetwarzaniu końcowym. Używając rastra do przedstawienia transformacji odległości i ich nakładek, możemy łatwo uzyskać statystyki - lokalne i globalne - w celu zmierzenia rozbieżności. Na przykład, możemy skupić się na wszystkich odległościach większych niż jakiś mały próg, badając ich rozkład częstotliwości:

Rycina 4

Na tym histogramie niebieskie paski oznaczają niebieskie obiekty, a czerwone paski czerwone. (Zwróć uwagę na skalę logarytmiczną na osi poziomej.) Ten histogram pokazuje oryginalne nałożone dane, a nie pochodne dane pochodne. Wybrał tylko te odległości większe niż trzy piksele na oryginalnym obrazie.

Te histogramy pokazują, że istnieje większe prawdopodobieństwo, że niebieskie obiekty leżą daleko od czerwonych obiektów niż na odwrót : niebieskie paski są wyższe niż czerwone i rozciągają się na większe odległości (po prawej). Cały arsenał statystyk opisowych jest teraz dostępny do kwantyfikacji różnic między dwoma zestawami danych. Te statystyki mogą być stosowane do całego regionu zainteresowania lub „okienkowane” w celu zbadania, w jaki sposób oba zestawy danych różnią się w zależności od lokalizacji.

Realizacja

Większość rastrowych GIS zapewnia transformację odległości euklidesową (taką jak EuclideanDistance w ArcGIS i r.grow.distance w GRASS) i wszystkie obsługują prostą (maskującą) nakładkę potrzebną do przeprowadzenia tej analizy. Rozmycie, w razie potrzeby, można wykonać za pomocą średniej sąsiedztwa lub splotu jądra (w tym „rozmycie gaussowskie” dostępne we wszystkich programach do przetwarzania obrazu). Większość GIS nie zapewnia jednak wystarczającego wsparcia dla pełnej analizy statystycznej danych rastrowych, ale są one dobre w eksportowaniu takich danych w formatach odczytywalnych przez oprogramowanie statystyczne i matematyczne, takie jak Rlub Mathematica (które zawierały wszystkie dane tutaj).

Whuber
źródło
Jak zawsze twoja odpowiedź to fascynująca lektura, a ja znajduję nowe rzeczy do nauczenia się i przemyślenia. Czy możesz mi również powiedzieć, w jaki sposób stworzyłeś wykres typu „rysowane ręcznie”?
Devdatta Tengshe,
3
@Devdatta Histogram został utworzony w Mathematica poprzez przetwarzanie końcowe z modyfikacją kodu na mathematica.stackexchange.com/questions/11350/xkcd-style-graphs . Dodatkowe przykłady takich grafik znajdują się na stronie stats.stackexchange.com/questions/49123/... i stats.stackexchange.com/questions/48973/... oraz stats.stackexchange.com/questions/48467/… .
whuber
4

Ponieważ na pierwszy rzut oka jest to problem sprawdzania poprawności geometrii, załaduj aktualne zdjęcia i sprawdź, czy możesz zweryfikować ulice jako istniejące lub jako obecne. Prawdopodobnie jeden zestaw danych jest nowszy i / lub bardziej kompletny. Dowiedz się, który zestaw danych ma największą dokładność poziomą, a który został zebrany ostatnio i według jakiego procesu. Czy jest to różnica między śladami tygrysa, osm, gis i GPS? Zdjęcia są tutaj twoim przyjacielem, przynajmniej dokładne zdjęcia, takie jak HAIP z ostatniego rocznika. Kryterium może być kompletność, zakres, dokładność, poprawność, waluta.

chwytak
źródło
1

Myślę, że podążając za powyższymi komentarzami i odpowiedziami (być może powinien to być także komentarz, a nie odpowiedź), ale użyłbym tego, co kiedykolwiek mapowania, jakie mam, aby zweryfikować pliki przez porównanie wizualne. Wybierz funkcje, w których dostępne są dokładne dane drukowane. Takie jak sieci drogowe (w Anglii Szkocja i Walia są dostępne za darmo z systemu operacyjnego).

Zgodnie z sugestią korzystania z Google Earth i zdjęć. Użyj wtyczki openlayers, aby załadować zdjęcia satelitarne w tle i porównać ponownie.

Wiele bezpłatnych dokładnych map dostępnych jako baza do porównania.

Ger
źródło
Niestety, zacząłem dokonywać tego porównania na podstawie faktu, że OSM i inne mapy OpenSource nie są tak dokładne, jak nam się wydaje. Ale wkład w wykorzystanie obrazów satelitarnych jest znaczący do naśladowania!
Styp