Narzędzia statystyki przestrzennej: analiza skupień danych rastrowych

9

Mam pozornie prosty problem, ale nie mogę znaleźć jasnej metodyki.

Mam za zadanie wytyczyć obszary miejskie wypukłymi wielokątami wektorowymi przy użyciu zestawu danych GIESZ Populacja świata od CIESIN

Ten zestaw danych zawiera wartości gęstości zaludnienia dla całego świata w postaci pliku rastrowego. Problem polega na tym, jak już zgadłeś, że wartości gęstości bardzo się zmieniają, a definicja „urbanistyczna” jest dość względna.

Próbowałem zastosować klasyczne podejście i obliczyłem nachylenia tak, jakby wartości gęstości były wysokościami, ale wartości nachyleń były również bardzo zróżnicowane i przestrzennie złożone, zawiłe.

Przyjrzałem się algorytmom klastrowania przestrzennego, narzędziom LISA (Local Indocators of Spatial Association), ArcGIS i GeoDa, ale jestem dość zagubiony wśród bardzo specyficznych narzędzi. Niektóre metody działają tylko na kształty wektorowe, więc konieczna jest przeklasyfikowanie i wektoryzacja (długie obliczenia).

Czy możesz mi pomóc w dopracowaniu zestawu metod i narzędzi do użycia? Dzięki !

Laurent Jégou
źródło
2
Jaka jest twoja definicja „miasta”? BTW, nie spodziewałbym się, że wszystkie obszary miejskie zostaną odpowiednio opisane przez wypukłe wielokąty. Wiele z nich ma kształty kontrolowane przez cechy geograficzne - góry, linie brzegowe i rzeki - które są wysoce niewypukłe.
whuber
Definicja nie jest podana, ani stała. Myślę, że celem jest znalezienie znacznie gęstszych obszarów pod względem środowiska, które jest różne. Więc pomysł na statystyki przestrzenne i LISA. Masz rację co do wypukłości, powinienem był napisać: „nie przecinają się i nie przecinają innych wielokątów”.
Laurent Jégou,
Jako uzupełnienie znalazłem cały moduł R poświęcony narzędziom do aglomeracji przestrzennej: spdep.
Laurent Jégou,

Odpowiedzi:

4

Pracowałem nad tym na moim mgr http://ian01.geog.psu.edu/papers/mscthesis.pdf - zasadniczo pracowałem nad zmianami gradientu, ale dyskusja może ci w tym pomóc.

Ian Turton
źródło
Dzięki, przeczytam go wkrótce, ale to obiecujące :-)
Laurent Jégou,
Wypróbowałem metodę podwójnej pochodnej Sobela, którą opisujesz w pracy, w ograniczonej strefie testowej i jest bardzo interesująca! Jasne jądro miejskie jest izolowane, a opisuje bardzo różne wartości gęstości. Wielkie dzięki :) Przy okazji użyłem darmowego oprogramowania typu open source do obliczenia zwojów i matematyki rastrowej: Opticks.
Laurent Jégou,
Miara sztucznego światła byłaby dobrym wskaźnikiem zastępczym dla warunków miejskich. Wyszukiwarka google powinna znaleźć przykłady badań.
b_dev
@ indiehacker - spojrzałem na to, ale jest to zależne kulturowo, na przykład Francja jest znacznie ciemniejsza niż Wielka Brytania.
Ian Turton
6

Z punktu widzenia gęstości zaludnienia „obszar miejski” powinien zasadniczo spełniać tylko kilka kryteriów aksjomatycznych :

  1. Jego granica nie powinna zawierać żadnych punktów o (względnie) wysokiej gęstości w porównaniu do maksymalnej gęstości w jej wnętrzu.

  2. Powinien być po prostu podłączony (bez „dziur”).

  3. Jego średnia gęstość zaludnienia powinna przekraczać określony z góry próg.

Aksjomat (1) jest najbardziej naturalny: jeśli punkt graniczny miałby mieć wysoką gęstość, po prostu przesunęlibyśmy granicę na zewnątrz, aby uwzględnić ten punkt w obszarze miejskim. Chciałbym zasugerować, że „krewny” oznacza jako część maksimum , na przykład jedną dziesiątą lub setną lub cokolwiek innego. Axiom (2) unika wykluczenia parków i innych regionów o niskiej gęstości, które naturalnie występują w miastach. Aksjomat (3) , który ponieważ zależy od progu, jest nieco arbitralny, eliminuje małe zwarte wioski.

W rzeczywistości istnieje co najmniej jeden inny element arbitralności: każda siatkowa mapa gęstości populacji pośrednio uśrednia populacje w lokalnych dzielnicach (w niektórych przypadkach równa jednej komórce i promieniu jądra dla szacunków gęstości jądra). Zaakceptujmy ten domyślny rozmiar sąsiedztwa (który można zmienić, uruchamiając najpierw środki ogniskowe lub inne wygładzenia jądra na oryginalnej mapie gęstości), ten próg populacji i poczucie „stosunkowo wysokiej” w aksjomacie 1 jako parametry ustawiane przez użytkownika, które kontrolują wynik.

Te aksjomaty prowadzą naturalnie do dość prostego algorytmu : należy zlokalizować lokalne maksima, patrzeć w ich sąsiedztwach, aż znajdzie się granica spełniająca aksjomat (1), wypełnić dowolne otwory, aby spełnić aksjomat (2), a następnie przesiać wszystkie takie obszary kandydujące zgodnie z (3). Odbywa się to w następujący sposób:

  1. Opcjonalnie wygładź mapę gęstości.

  2. Wykonaj algorytm „wypełniania” na mapie związanej z gęstością (patrz poniżej).

  3. Region Pogrupuj wynik.

  4. Usuń otwory z wielokątów zgrupowanych według regionu.

  5. Wykonuj sumy strefowe gęstości zaludnienia na wypełnionych wielokątach.

  6. Wyeliminuj wszelkie wielokąty o sumach (lub średnich gęstościach) poniżej progu populacji (gęstości).

To, co zostało, to twoje rozwiązanie.

Powiem trochę więcej o kroku (1), który jest kluczowy. Algorytm wypełniania identyfikuje „zatapianie” i „wypełnia” je do stałej wysokości powyżej ich wysokości. To jest dokładnie to, co Aksjomat (1) prosi nas zrobić, pod warunkiem (a) możemy dokonać „sink” odgrywać rolę „maksimum lokalne” i (b) make „stała kwota powyżej” odgrywać rolę „stałą frakcję o. „ Sposobem na to jest wypełnienie logarytmu ujemnego gęstościzamiast samej gęstości. (Dodaj najpierw małą gęstość do gęstości - powiedzmy, około 0,1 osoby na kilometr kwadratowy - przed pobraniem dziennika, aby wszelkie komórki zawierające zera nie spowodowały problemów.) „Jeziora” w ujemnej gęstości dziennika identyfikują kandydata obszary miejskie. Nadal masz trzy niezależne parametry do gry (wprowadzanie w krokach 0, 1 i 5); ich ustawienie będzie wymagało przemyślenia tego, co naprawdę rozumiesz przez „obszar miejski”, a także pewnych eksperymentów.

Whuber
źródło
Dziękuję za szczegółową odpowiedź. Spróbuję znaleźć odpowiednie narzędzia programowe (lub je zaprogramować), aby przetestować algorytm wypełniania z logiem ujemnym, co wydaje się być dobrym tropem.
Laurent Jégou,