Próbuję ustalić, czy obecność dużej liczby czynnych żołnierzy wojskowych na danym obszarze jest skorelowana przestrzennie z wyższym / niższym poziomem przestępstw z użyciem przemocy. To znaczy, czy obszary otaczające duże bazy wojskowe są średnio / mniej gwałtowne niż obszary, które nie znajdują się w pobliżu baz wojskowych?
Pracuję z następującymi dwoma zestawami danych:
(1) zestaw danych punktowych baz wojskowych w kontynentalnych USA i odpowiadających im poziomów żołnierzy:
(2) zestaw ogólnopolskich danych o wskaźnikach przestępstw z użyciem przemocy według miasta:
Czuję, że szukam jakiegoś modelu opartego na grawitacji , w którym funkcja „masy” podaje poziomy żołnierzy w każdej bazie. Tak więc obecność dużego oddziału wywierałaby wpływ na większy obszar i miałaby silniejszy wpływ w pobliżu środka masy (tj. Lokalizacji punktu w warstwie GIS).
Myślę, że koncepcyjnie wyglądałoby to mniej więcej tak:
Na tym schemacie X, Y, Z przedstawiają bazy wojskowe. a, b, c, d reprezentują miasta (każde z nich ma pole wskaźnika przemocy w tabeli atrybutów).
Gradient wokół baz reprezentuje pole wpływu, które maleje wykładniczo wraz z odległością od podstawy centroidu. Większa obecność oddziałów oznacza większy promień wpływu (z pewną maksymalną odległością progową), a także silniejszy wpływ w pobliżu centrum w stosunku do obszarów w pobliżu mniejszej bazy.
Każdemu miastu zostanie przypisany wynik oparty na zsumowaniu wielkości wszystkich wektorów „siły” ze wszystkich otaczających baz, w których promieniu oddziaływania się znajdują. Na przykład na moim schemacie Miasto a miałoby wynik 0, ponieważ leży poza promieniem bazy. Miasto b będzie wpływać tylko przez bazowej X . Miasto C będzie wpływać tylko przez podstawowy Z , a jego wynik byłby mniejszy niż B , ponieważ X jest o wiele większa niż podstawa Z . Wreszcie miasto d leży w promieniu obu baz X i Y, otrzyma wynik oparty na zsumowaniu wielkości wpływu z obu baz. Sprawdziłbym wtedy, czy istnieje korelacja między wyższym wynikiem dla miasta a wyższym poziomem przemocy.
Przyglądałem się różnym modelom opartym na grawitacji ( modele Huffa itp.), Ale nie byłem w stanie znaleźć tyle, co QGIS / Python i nie jestem pewien, jak wdrożyć to, co opisałem powyżej ... Czy ktoś ma jakieś sugestie dla tego? Czy któryś z was wcześniej przeprowadzał tego typu analizy w innych obszarach?
Zatem TLDR to:
- Jakich technik statystycznych mogę użyć do tego rodzaju pytań?
- Czy są jakieś narzędzia wbudowane w QGIS (lub dostępne jako wtyczki), które mogą to zrobić?
- Jeśli w QGIS nie ma czegoś takiego, czy istnieją biblioteki Pythona, które mogą przeprowadzić tego rodzaju analizę?
źródło
Odpowiedzi:
Rozszerzając mój komentarz powyżej
To, co prawdopodobnie prawdopodobnie skończysz, to regresja liniowa z opóźnieniem przestrzennym, która uwzględnia korelację przestrzenną niektórych twoich zmiennych (będę musiał spojrzeć na moje uwagi na ten temat).
Luc Anselin był pionierem w tej dziedzinie i powinieneś rzucić okiem na jego prace, zwłaszcza (bezpłatne) narzędzia i dokumentację w GeoDa Center . Oba te narzędzia mogą Cię zainteresować:
Podczas wyszukiwania wtyczki PySAL dla QGIS znalazłem coś, co nie było aktualizowane od lat, ale możesz mieć więcej szczęścia.
źródło