Mam duży zestaw danych z 36 tys. Punktów reprezentujących użytkowanie gruntów komercyjnych, każdy z polem zawierającym materiał kwadratowy. Przeprowadziłem analizę gęstości jądra dla tego zestawu danych, tworząc raster pokazujący gęstość komercyjnych powierzchni kwadratowych w całym obszarze metra. Muszę podzielić ten raster na regiony odpowiadające lokalnym maksimom, które nazywam „centrum”. Ustaliłem już lokalizację centrów, a teraz muszę zrobić jedną z dwóch rzeczy:
użyj narzędzia grupowania punktów, takiego jak „partycjonowanie wokół medoidów”, aby pogrupować punkty w klastry wokół zidentyfikowanych centrów. Problem z tą metodą polega na tym, że jest ona intensywna obliczeniowo, a tym bardziej, jeśli spróbuję użyć macierzy odmienności do ważenia punktów według wielkości.
w jakiś sposób podziel raster gęstości jądra (który z grubsza przypomina raster terenu) na poszczególne „wzgórza” wokół każdego centrum. Ale nie mogę wymyślić żadnego narzędzia do tego.
Ten problem trapił mnie od jakiegoś czasu i miałem nadzieję, że będę w stanie wykonać metodę klastrowania w R, ale jest to czasochłonne i brakuje mi czasu. Czy ktoś zna prostą metodę podziału rastrów gęstości na dzielnice intensywności lub szybkiego grupowania dużych zbiorów danych?
Odpowiedzi:
Dyskusja na temat ściśle powiązanego postu ujawniła proste, skuteczne rozwiązanie : znaleźć „wzgórza”, obrócić siatkę do góry nogami (negując jej wartości) i znaleźć zlewiska. Wzgórza są zlewami, a granice zlewisk dzielą siatkę na te zlewozmywaki.
źródło
Najprostszą odpowiedzią byłoby użycie progu do maskowania obszarów, które spadną poniżej progu. To powinno dać ci wyraźne obszary wokół twoich centrów. Następnie powinno być możliwe przekształcenie tych obszarów w kształty.
Można również stwierdzić, statystyka przestrzenna narzędzi: analizy klastrowej na danych rastrowych pożyteczną dyskusję o podobnym problemie.
źródło
Myślę, że powinieneś powrócić do pierwotnego problemu: znajdź skupiska komercyjnych powierzchni kwadratowych w całym regionie metra.
Zakładam, że twoje punkty to centroidy działek o wartości komercyjnej powierzchni kwadratowej? Zakładam, że możesz mieć również warstwę działek wielokątnych o całkowitej powierzchni kwadratowej dla każdej działki? To daje zestaw skrzynek (centroidy) i populację (wielokąty działek) odpowiednio dla reklamy komercyjnej i materiału kwadratowego.
Idź weź SatScan http://www.satscan.org/ i uruchom tylko model kosmiczny Poissona, a będziesz mieć swoje klastry powierzchni komercyjnych w dość szybkiej kolejności. (Możesz także użyć powierzchni ziemi jako populacji, a nie powierzchni budynku. To może być nawet lepsza populacja.)
źródło