Podane punkty danych o długości i szerokości geograficznej oraz trzeciej wartości właściwości tego punktu. Jak mogę grupować punkty w grupy (podregiony geograficzne) na podstawie wartości nieruchomości? Przeszukałem google i odkryłem, że problem ten nazywa się „klastrowaniem przestrzennym” lub „regionalizacją”. Nie znam się jednak na obsłudze danych geograficznych i nie mam pojęcia, jakie algorytmy są dobre i które pakiety Python / R są odpowiednie do tego zadania.
Aby dać bardziej intuicyjny obraz tego, czego chcę, powiedzmy, że moje wykresy rozproszenia danych są następujące:
Każda kropka jest punktem, x jest długością geograficzną, y jest szerokością geograficzną, a mapa kolorów pokazuje, czy wartość jest duża czy mała. Chcę podzielić te punkty na podregiony / grupy / klastry na podstawie lokalizacji i podobieństwa wartości. Podobnie jak poniżej (nie jest to dokładnie to, czego chcę, aby pokazać intuicyjny pomysł.):
Jak mogę to osiągnąć?
źródło
Odpowiedzi:
Pakiet rioja zapewnia funkcjonalność dla ograniczonego zgrupowania hierarchicznego. Dla tego, co myślisz o „ograniczeniu przestrzennym”, określisz cięcia na podstawie odległości, podczas gdy dla „regionalizacji” możesz użyć k najbliższych sąsiadów. Zdecydowanie polecam rzutowanie danych, aby znajdowały się one w układzie współrzędnych opartych na odległości.
źródło