Od wielokąta do ciągłej miary różnorodności?

11

Po pierwsze; Próbowałem znaleźć podobne pytanie, ale bez powodzenia. Może dlatego, że jestem całkiem nowy w GIS i tak naprawdę nie wiem, czego dokładnie szukam. Jeśli ktoś wskaże mi podobny problem, chętnie usunę ten post.

Muszę stworzyć zmienną „ciągłą” lub rastrową (w małych komórkach siatki) różnorodności populacji dla danego kraju. Mam plik kształtu pokazujący rozmieszczenie grup etnicznych w wielokątach (ryc. 1), a wynik, którego szukam, jest „średnim wskaźnikiem różnorodności” w każdej jednostce administracyjnej (jednostki AU, w tym przypadku 360 okręgów nigeryjskich).

Ryc. 1 - Wielokąty grup ludności

Ryc. 1. Grupy populacji wielokątów w Nigerii

Rozwiązaniem, które wymyśliłem, było uzyskanie procentu powierzchni każdego wielokąta w każdej jednostce AU i obliczenie z tego indeksu heterogeniczności. Problem polega jednak na tym, że zostawiłbym na boku sporo informacji z powodu rozmieszczenia jednostek administracyjnych. Jak pokazano na ryc. 2, kwadraty „a”, „b” i „c” miałyby ten sam „wskaźnik segregacji”, ale jasne jest, że nie znajdują się one w tej samej pozycji w stosunku do „gorących punktów”.

Ryc. 2

Ryc. 2.

Pomyślałem więc, że innym rozwiązaniem może być stworzenie mapy siatki i obliczenie odległości do najbliższej granicy, ale ponowne udostępnienie tylko jednej granicy nie jest tym samym, co w środkowej części mapy, gdzie mieszka kilka grup.

Po znalezieniu tego pytania wydaje mi się, że wielokąty można przekształcić w punkty za pomocą ich centroidów, a następnie zastosować tę samą metodę. Ale prawda jest taka, że ​​jestem w tym nowy i na to pytanie tak naprawdę nie ma jednoznacznej odpowiedzi. Jak mogłem zrobić coś takiego?

Korzystając z innego przykładu, chcę stworzyć coś takiego (zdjęcia z tej strony ):

1 2)

Biorąc pod uwagę rozkład niektórych punktów o różnych cechach jakościowych , uzyskaj miarę różnorodności, na podstawie której mógłbym oszacować „średnią heterogeniczność” każdej jednostki administracyjnej.

Jak mogłem to zrobić? Używam R i QGIS, więc nie mam nic przeciwko, na której platformie jest oparte rozwiązanie.

Fran Villamil
źródło

Odpowiedzi:

5

Naprawdę dałbym SpatiaLite szansę na zrobienie tego! Najwygodniej możesz użyć wtyczki QSpatiaLite w QGIS.

Wystarczy skonfigurować siatkę wielokąta o rozsądnym rozmiarze dla komórek siatki. Następnie przecinaj siatkę z wielokątem grupy etnicznej i oblicz powierzchnię każdego skrzyżowania. W wynikowej tabeli możesz obliczyć swoje wskaźniki, używając obszarów przecięcia, które są obszarami grup etnicznych w każdej komórce siatki, jako „miernik liczebności” (tak nazwałby to ekolog)!

Zakładając, że warstwa grup etnicznych nazywa się „Grupy etniczne”, z polem „grupa”, a siatka wielokątów nosi nazwę „Siatka” z polem „ID”, to zapytanie SQL miałoby zastosowanie:

SELECT 
  g.ID AS gID, 
  e.group AS egr,
  AREA(INTERSECTION(e.geometry, g.geometry)) AS egr_area
FROM Grid AS g JOIN EthnicGroups AS e 
ON INTERSECTS(g.Geometry, e.Geometry)
ORDER BY gID, egr_area ASC

Do obliczania wskaźników różnorodności za pomocą specjalnych wzorów użyłbym R, zwijając te „obfitości”, uzyskując jedną wartość dla każdej komórki siatki, którą ostatecznie można połączyć z powrotem z geometriami siatki!

Aby uzyskać średnią różnorodność dla każdej jednostki AU, możesz użyć wskaźników różnorodności, które dołączyłeś do sieci. Ponownie, używając SpatialLite grupując wartości w wielokątach AU z zastosowaniem funkcji średniej.

Zabawne, że niedawno napisałem blog na ten temat, który może dać ci pomysł: http://thebiobucket.blogspot.co.at/2014/12/usecase-find-dominant-species-and.html

Jeśli o mnie chodzi, radzę pominąć w tym względzie ideę „ciągłości”, ponieważ różnorodność ma znaczenie jedynie w odniesieniu do jednostki przestrzennej, na której się opiera. Myślę więc, że wszystkie podejścia i fantazyjne techniki, które wykorzystują jakiekolwiek uśrednianie lub interpolację w stosunku do innych jednostek niż jednostki przestrzenne, na których opierają się twoje wskaźniki, nie dodadzą niczego wartościowego, ale raczej zaciemnią wynik!

Oto mapa pokazująca różnorodność płazów (a nie etniczność;), dla której zastosowałem całkiem tę samą metodę: wprowadź opis zdjęcia tutaj

ps: Ten link może być interesujący, jeśli chcesz uzyskać różnorodność w obrębie danego promienia wyszukiwania!

Kay
źródło
4

W QGIS możesz wygenerować siatkę punktów na swoich wielokątach. Znajdziesz tę funkcję w Vector -> Narzędzia badawcze (myślę, że nazywa się tak w języku angielskim, moja wersja QGIS jest w innym języku). Musisz znaleźć rozsądną szczegółowość, jeśli chodzi o odstępy siatki punktów.

Następnie w menu Wektor wykonujesz Połącz atrybuty według lokalizacji (znalezione w obszarze Zarządzanie danymi), wykorzystując punkty jako cel, a wielokąty etniczne jako źródło.

Teraz masz siatkę punktów z atrybutem etnicznym dla każdego punktu.

Tutaj jest trochę trudniej. Możesz wygenerować raster, używając tych punktów, jeśli przekodujesz swój atrybut na wartość liczbową (na przykład używając narzędzia Utwórz równoważne pole numeryczne w przyborniku przetwarzania QGIS). Następnie możesz użyć Utwórz siatkę w obszarze Raster -> Analiza. Tutaj możesz eksperymentować ze średnią przesuwną lub analizą najbliższego sąsiada, a następnie użyć statystyk strefowych (istnieje szereg opcji w przyborniku Przetwarzanie, a także w menu rastrowym).

Sztuczka polega na tym, jak uzyskać indeks heterogeniczności, ignorując dowolną wartość utworzoną przez przekodowanie atrybutów na indeks liczbowy, ale możesz mieć tutaj własne pojęcie. Nie jestem pewien, jak sobie z tym poradzić, nie poświęcając zbyt wiele czasu na to, co mam teraz robić :)

Innym pomysłem jest załadowanie siatki punktów do bazy danych Spatialite (lub PostGIS, ale jest to większa operacja, aby uruchomić). Następnie można użyć funkcji SQL i funkcji przestrzennych w bazie danych, aby przetestować powiedzieć wszystkie punkty w określonym promieniu od każdego punktu do nadaj mu lokalny indeks wariancji, a następnie wygeneruj raster na podstawie tej wartości. Ostatnio trochę z tym pracowałem.

Mam nadzieję, że daje to kilka pomysłów! Jeśli chcesz dyskutować dalej, skorzystaj z komentarzy.

hexamon
źródło
Wielkie dzięki!! Spróbuję go rozwiązać i wrócę do ciebie, jeśli będę miał dalsze problemy (na pewno to zrobię).
Fran Villamil,
2

Pytanie zawiera szereg założeń, które należy rozwiązać, zanim przejdziesz do pytania dotyczącego wdrożenia. Podany przykład to analiza różnorodności biologicznej oparta na próbce odmian danego gatunku rośliny. Przejrzałem instrukcję obsługi oprogramowania, które zostało użyte do wygenerowania tego rastra, i nic nie wskazuje na to, że jest on odpowiedni lub został zastosowany w populacjach ludzkich. Środek ciężkości obszaru kultury ludzkiej (który proponujesz wykorzystać do analizy) nie jest w żaden sposób analogiczny do próbki (tj. Faktycznej obserwacji) zbioru roślin.

Bliskość ludzkich podgrup (podzielonych wzdłuż dowolnego wymiaru, tutaj wymiarem jest pochodzenie etniczne) można wyrazić jako miarę różnorodności lub miarę segregacji. Jednym z szeroko stosowanych wskaźników różnorodności jest wskaźnik Herfindahla , który waha się od 0 do 1 i jest mały, gdy obszar ma wiele małych grup, i duży, gdy obszar ma wiele dużych grup. Obliczany jest w obrębie populacji lub obszaru bez odniesienia do czegokolwiek poza tą populacją lub obszarem. Jest to problematyczne, ponieważ interesuje Cię interakcja przestrzenna ponad granicami administracyjnymi.

Jedną z powszechnie stosowanych miar segregacji jest wskaźnik niepodobności , który waha się od 0 do 1 i jest mały, gdy podobszary mają taki sam rozkład populacji jak większy region, i duży, gdy podobszary są wyłącznie jedną grupą lub inną. Zazwyczaj oblicza się go w regionie, dla którego dostępne są informacje demograficzne dla wielu podobszarów (np. Można obliczyć indeks podobieństwa czarno-białego dla obszaru metropolitalnego na podstawie danych demograficznych dla wszystkich obszarów spisu ludności w obszarze metropolitalnym). Wong (2002) modelował lokalniesegregacja poprzez obliczenie wskaźnika odmienności dla każdego podobszaru w oparciu o populację sąsiednich (tj. sąsiadujących) podobszarów, a nie regionu jako całości. Ograniczeniem tego środka jest to, że może on działać tylko dla dwóch grup jednocześnie. Wykorzystałem go jednak w swoich własnych badaniach, wykorzystując dwie najbardziej zaludnione grupy w każdej strefie sąsiadów.

Wskazałeś, że chcesz obliczyć różnorodność dla każdej jednostki administracyjnej (AU). Ale mówisz także, że musisz stworzyć ciągły raster różnorodności. Nie jest dla mnie jasne, czy rzeczywiście chcesz ciągłego rastra różnorodności, czy uważasz, że potrzebujesz go do obliczenia różnorodności AU. Jeśli tak naprawdę chcesz ciągłej różnorodności, polecam przyjrzeć się O'Sullivan & Wong (2007) , która wizualizuje ciągłą różnorodność za pomocą estymatora gęstości jądra. Ma to wpływ na rozliczanie interakcji między populacjami ponad granicami administracyjnymi, które wskazujesz, że chcesz.

OTOH, jeśli naprawdę chcesz różnorodności według jednostek administracyjnych, możesz to zrobić za pomocą indeksu Herfindahla lub lokalnego indeksu niepodobieństwa. Wymaga to jednak informacji o cechach demograficznych w ramach każdej UA. Zakładam, że powodem korzystania z mapy obszarów etnicznych jest brak danych o populacji etnicznej dla UA. Ale jeśli znasz populację każdej UA i przecinasz ją z siatką obszarów etnicznych, możesz przydzielić populację AU do obszarów etnicznych. Ważnym założeniem w tej i innych zaproponowanych dotychczas odpowiedziach jest to, że zakładają oni, że gęstość zaludnienia jest stała w całej UA lub regionie etnicznym. To założenie wydaje się prima facie nieprawdopodobne, ale znasz dane lepiej ode mnie i może być to wygodne z tym założeniem.

W oparciu o moje rozumienie twoich celów myślę, że moje podejście byłoby następujące:

  1. Modelowa populacja w podjednostkach, gdzie podjednostki mogą być skrzyżowaniem jednostek AU i obszarów etnicznych lub siatką wektorową lub rastrową. Mając wystarczająco dużo czasu, chciałbym spróbować w obie strony.
  2. Oblicz wskaźnik Herfindahla dla każdej jednostki AU, ale po Wongu (2002) obliczyłem wskaźnik Herfindahla na podstawie sąsiedztwa każdej jednostki AU, a nie tylko populacji wewnątrz jednostki AU. Mając wystarczająco dużo czasu, eksperymentowałem z dzielnicami opartymi na ciągłości i odległości.

Oczywiście nic z tego nie dotyczy technicznego wdrożenia, ale jeśli przekażesz mi jakieś uwagi na ten temat, możemy przejść od tego momentu.

PS: Artykuły akademickie, z którymi się łączyłem, są zamknięte. Jeśli OP nie ma dostępu do biblioteki akademickiej, skontaktuj się ze mną przez e-mail, a ja Ci je dostarczę.

Lee Hachadoorian
źródło
+1 Być może nie jest technicznie szczegółowy, ale nadal bardzo przydatny i pouczający!
Joseph