Model szacowania gęstości zaludnienia

14

Baza danych (populacja, powierzchnia, kształt) może być wykorzystana do mapowania gęstości zaludnienia poprzez przypisanie stałej wartości populacji / obszaru do każdego kształtu (który jest wielokątem, takim jak blok spisu, obszar, okręg, stan, cokolwiek innego). Jednak populacje zwykle nie są równomiernie rozmieszczone w obrębie swoich wielokątów. Mapowanie dasymetryczne to proces udoskonalania tych szacunków gęstości za pomocą danych pomocniczych. Jest to ważny problem w naukach społecznych, jak wskazuje ten najnowszy przegląd .

Załóżmy zatem, że mamy dostępną pomocniczą mapę pokrycia terenu (lub dowolny inny dyskretny czynnik). W najprostszym przypadku możemy wykorzystać oczywiście obszary nienadające się do zamieszkania, takie jak zbiorniki wodne, aby wyznaczyć obszary, w których nie ma populacji, i odpowiednio przypisać całą populację pozostałym obszarom. Mówiąc bardziej ogólnie, każda jednostka spisu powszechnego jest wyryta na części o powierzchni , . Nasz zestaw danych zostaje w ten sposób powiększony o listę krotekk x j i i = 1 , 2 , , kjkxjii=1,2,,k

(yj,xj1,xj2,,xjk)

gdzie jest populacją (zakładaną mierzoną bez błędów) w jednostce i - chociaż nie jest to ściśle przypadek - możemy założyć, że każdy jest również dokładnie zmierzony. W tych warunkach celem jest podzielenie każdego na sumę j x j i y jyjjxjiyj

yj=zj1+zj2++zjk

gdzie każde i szacuje populację w ramach jednostki zamieszkałej w klasie pokrycia terenu . Szacunki muszą być obiektywne. Ta partycja udoskonala mapę gęstości zaludnienia, przypisując gęstość do przecięcia wielokąta Spisu i klasy pokrycia terenu . z j i j i z j i / x j i j th i thzji0zjijizji/xjijthith

Ten problem różni się od standardowych ustawień regresji w znaczący sposób:

  1. Partycjonowanie każdego musi być dokładne. yj
  2. Składniki każdej partycji muszą być nieujemne.
  3. W założeniu nie ma błędu w żadnych danych: wszystkie liczby ludności i wszystkie obszary są poprawne. x j iyjxji

Istnieje wiele podejść do rozwiązania, takich jak metoda „ inteligentnego mapowania dasymetrycznego ”, ale wszystkie te, o których czytałem, mają elementy ad hoc i oczywisty potencjał stronniczości. Szukam odpowiedzi, które sugerują twórcze, możliwe do obliczenia metody statystyczne. Natychmiastowa aplikacja dotyczy zbioru c. - Jednostki spisowe średnio po 40 osób (choć znaczna część ma 0 osób) i około tuzina klas pokrycia terenu. 10 6105106

Whuber
źródło
Naprawiono problem z formatowaniem. To był błąd.
Rob Hyndman,
@Rob Dziękuję i dziękuję wszystkim, którzy na to spojrzeli: widziałem wasze komentarze, zanim zostały usunięte i jestem wdzięczny za wasze wysiłki.
whuber
1
Także ten: P. A Zandbergen i D. A Ignizio, „Porównanie technik mapowania dasymetrycznego do szacowania populacji na małych obszarach”, Kartografia i informatyka geograficzna 37, no. 3 (2010): 199–214. ingentaconnect.com/content/acsm/cagis/2010/00000037/00000003/... Co wydaje się wymagać połączenia.
fgregg,
1
Ten artykuł może być przydatny: Hwahwan Kim i Xiaobai Yao, „Recenzja interpolacji piknofilowej: integracja z metodą mapowania dasymetrycznego”, International Journal of Remote Sensing 31, nr. 21 (2010): 5657. informaworld.com/10.1080/01431161.2010.496805
fgregg
1
Wiesz, mapowanie dasymetryczne ostatecznie stanowi problem wnioskowania ekologicznego. Pomocna
fgregg

Odpowiedzi:

4

Możesz sprawdzić pracę Mitchel Langford na mapowaniu dasymetrycznym.

Buduje rastry reprezentujące rozmieszczenie ludności Walii, a niektóre z jego metodologicznych podejść mogą być przydatne tutaj.

Aktualizacja: Możesz także zapoznać się z pracą Jeremy'ego Mennisa (szczególnie te dwa artykuły).

radek
źródło
2
Dziękuję Ci. Ta praca stanowi wskaźnik do sieci najnowszych badań nad mapowaniem dasymetrycznym.
whuber
2

xji

zji=f(xji,β)

f(.)

zji=f(xji,β)+ϵji

gdzie,

ϵjiN(0,σ2)

Założenie błędu dystrybucji w odniesieniu do terminu błędu służy wyłącznie celom ilustracyjnym. W razie potrzeby możemy go odpowiednio zmienić.

yjif(.)

iϵji=0

if(xji,β)=yj

zjizjf(xji,β)fj

zjN(fj,σ2I)I(fje=yj)I((zjfj)e=0)

gdzie,

e

yj

yjσ2

Edytuj 1

Zastanawiając się nad powyższym sformułowaniem można uprościć, ponieważ ma więcej ograniczeń niż jest to konieczne.

zji=f(xji,β)+ϵji

gdzie,

ϵjiN(0,σ2)

zjizjf(xji,β)fj

zjN(fj,σ2I)I(zje=yj)

gdzie,

e

zj


źródło
2
@ Srikant Dziękuję. Kiedy zadawałem to pytanie, myślałem w podobny sposób i od tego czasu przetestowałem GLM (rozkład Poissona z linią liniową ), a także kilka innych modeli. Niestety wygląda teraz na to, że jakikolwiek model oparty wyłącznie na rodzaju i proporcjach pokrycia terenu nie będzie działał dobrze: próbka tych danych sugeruje, że wzorce populacji zależą od szerszego kontekstu przestrzennego. W takim razie musielibyśmy uwzględnić współzmienne przestrzennie opóźnione w modelu liniowym.
whuber