Jak zawsze zależy to od twoich celów i charakteru danych. W przypadku całkowicie zmapowanych danych potężnym narzędziem jest funkcja L Ripleya, bliski krewny funkcji K Ripleya . Wiele oprogramowania może to obliczyć. ArcGIS może już to zrobić; Nie sprawdziłem CrimeStat to robi. Tak zrobić geoda i R . Przykład użycia z powiązanymi mapami pojawia się w
Sinton, DS i W. Huber. Mapowanie polki i jej dziedzictwa etnicznego w Stanach Zjednoczonych. Journal of Geography Vol. 106: 41–47. 2007
Oto zrzut ekranu CrimeStat wersji „funkcji L” Ripleya K:
Niebieska krzywa dokumentuje bardzo nielosowy rozkład punktów, ponieważ nie leży między czerwonymi i zielonymi pasmami otaczającymi zero, w którym powinien znajdować się niebieski ślad funkcji L rozkładu losowego.
W przypadku próbkowanych danych wiele zależy od charakteru próbkowania. Dobrym źródłem tego, dostępne dla osób o ograniczonej (ale nie całkowicie nieobecny) w tle matematyki i statystyki, jest podręcznik Stevena Thompsona na Sampling .
Zasadniczo większość porównań statystycznych można zilustrować graficznie, a wszystkie porównania graficzne odpowiadają lub sugerują statystycznego odpowiednika. Dlatego wszelkie pomysły uzyskane z literatury statystycznej prawdopodobnie sugerują przydatne sposoby mapowania lub innego graficznego porównywania dwóch zestawów danych.
Uwaga: następujące komentarze zostały zredagowane po komentarzu Whubera
Możesz zastosować podejście Monte Carlo. Oto prosty przykład. Załóżmy, że chcesz ustalić, czy rozkład zdarzeń przestępczych A jest statystycznie podobny do rozkładu B, możesz porównać statystyki między zdarzeniami A i B z empirycznym rozkładem takiej miary dla losowo przypisanych „markerów”.
Na przykład, biorąc pod uwagę rozkład A (biały) i B (niebieski),
losowo przypisujesz etykiety A i B do WSZYSTKICH punktów w połączonym zestawie danych. To jest przykład pojedynczej symulacji:
Powtarzasz to wiele razy (powiedzmy 999 razy) i dla każdej symulacji obliczasz statystykę (w tym przykładzie statystyczną średnią najbliższego sąsiada) przy użyciu losowo oznaczonych punktów. Poniższe fragmenty kodu znajdują się w R (wymaga użycia biblioteki spatstat ).
Następnie możesz porównać wyniki graficznie (czerwona pionowa linia to oryginalna statystyka),
lub numerycznie.
Pamiętaj, że średnia statystyczna najbliższego sąsiada może nie być najlepszą miarą statystyczną twojego problemu. Statystyki takie jak funkcja K mogą być bardziej odkrywcze (patrz odpowiedź Whubera).
Powyższe można łatwo wdrożyć w ArcGIS za pomocą Modelbuilder. W pętli losowo przypisuje wartości atrybutów do każdego punktu, a następnie oblicza statystyki przestrzenne. Powinieneś być w stanie zliczyć wyniki w tabeli.
źródło
spatstat
pakiecie.Możesz sprawdzić CrimeStat.
Według strony internetowej:
źródło
Prostym i szybkim podejściem mogłoby być stworzenie map cieplnych i mapy różnic tych dwóch map cieplnych. Powiązane: Jak budować skuteczne mapy cieplne?
źródło
Załóżmy, że dokonałeś przeglądu literatury na temat autokorelacji przestrzennej. ArcGIS posiada różne narzędzia wskaż i kliknij, aby to zrobić za pomocą skryptów Toolbox: Narzędzia statystyki przestrzennej -> Analiza wzorców .
Możesz pracować wstecz - znajdź narzędzie i przejrzyj zaimplementowany algorytm, aby sprawdzić, czy pasuje on do Twojego scenariusza. Kiedyś użyłem Indeksu Morana, badając zależność przestrzenną w występowaniu minerałów glebowych.
źródło
W wielu programach statystycznych można uruchomić dwuwymiarową analizę korelacji, aby określić poziom korelacji statystycznej między dwiema zmiennymi a poziomem istotności. Następnie można wykonać kopię zapasową wyników statystycznych, mapując jedną zmienną za pomocą schematu chloropleta, a drugą zmienną za pomocą stopniowanych symboli. Po nałożeniu można następnie określić, które obszary wykazują relacje wysokie / wysokie, wysokie / niskie i niskie / niskie relacje przestrzenne. Ta prezentacja ma kilka dobrych przykładów.
Możesz także wypróbować unikalne oprogramowanie do geowizualizacji. Bardzo podoba mi się CommonGIS dla tego rodzaju wizualizacji. Możesz wybrać dzielnicę (przykład), a wszystkie przydatne statystyki i wykresy będą dostępne od razu. To sprawia, że analiza map wielu zmiennych jest bardzo prosta.
źródło
Świetna byłaby do tego analiza kwadratu. Jest to podejście GIS umożliwiające podkreślenie i porównanie wzorów przestrzennych różnych punktowych warstw danych.
Zarys analizy kwadratu, która kwantyfikuje relacje przestrzenne między wielopunktowymi warstwami danych, można znaleźć na stronie http://www.nccu.edu/academics/sc/artsandsciences/geospatialscience/_documents/se_daag_poster.pdf .
źródło