Mam krajowy zbiór danych ~ 1,4 miliona gospodarstw domowych. Tam mam informacje na temat czynszu, wielkości (liczby pokoi i m2) oraz niektórych dodatkowych cech każdego gospodarstwa domowego.
Chciałbym wykorzystać te dane do stworzenia powierzchni cen czynszów dla całego kraju i wykorzystać te informacje jako przybliżenie do oszacowania wartości pozostałych ~ 1,5 miliona gospodarstw domowych, które są własnością lub nie mają informacji o czynszach.
Kilka pytań tutaj:
Czy takie podejście jest w ogóle odpowiednie dla tego rodzaju problemu?
Którą metodę interpolacji najlepiej tu zastosować?
Czy można również wziąć pod uwagę informacje, na przykład o wielkości gospodarstwa domowego?
Korzystam z ArcGIS 9.3 z licencją ArcInfo.
Odpowiedzi:
Pomysł jest dobry, ale proponowane wdrożenie może być zbyt uproszczone, aby było wiarygodne. Czynsze są własnością systemów ekonomicznych. Poza wpływem lokalizacji są one powiązane z innymi zmiennymi ekonomicznymi w istotny sposób: stan lokalnej (i krajowej) gospodarki, lokalne ceny mieszkań, dostępność kapitału, wskaźniki zatrudnienia itp. Aby wykonać dobrą pracę, potrzebujesz modelu ekonometrycznego . Korzystne może być stosowanie pewnych terminów opóźnień przestrzennych , ale zanim takie komplikacje zostaną rozważone, należy uwzględnić wiele z tych współzmiennych ekonomicznych.
Powiedziawszy to, twoja zdolność do sukcesu zależy od relacji między twoimi danymi, a czynszami, które chcesz przewidzieć. Jeśli twoje dane są reprezentatywną próbką z całego kraju i są rozproszone geograficznie - pomyśl o domach jak rodzynkach na ciasteczku, a masz dane o wszystkich innych rodzynkach w ciasteczku - wtedy stosunkowo prosty model może wystarczyć. Jeśli Twoje dane są zorientowane geograficznie - być może masz informacje o rodzynkach po prawej stronie pliku cookie i chcesz przewidzieć rodzynki po lewej stronie - problem jest trudniejszy.
Dobrym punktem wyjścia byłoby dopasowanie konwencjonalnego liniowego modelu ekonometrycznego czynszów do cech gospodarstw domowych i cech przestrzennych brutto (takich jak polityka podatkowa państwa lub powiatu), obliczenie reszt i rozpoczęcie eksploracji przestrzennej (za pomocą wariografii , przestrzennych wygładzeń jądra itp.), aby uchwycić efekty geograficzne.
Odpowiednie oprogramowanie jest dostępne jako dodatki do R .
źródło
Jako bardzo łagodne wprowadzenie do tematów dotyczących regresji przestrzennej gorąco polecam sprawdzenie skoroszytu GeoDa (rozdziały 22–25 będą najbardziej interesujące). Nawet jeśli nie chcesz korzystać z oprogramowania, jest to bardzo kompleksowy przegląd regresji przestrzennej.
Czy wbudowane funkcje regresji w ArcMap poradzą sobie z tak dużą ilością danych (nie to, że żadne oprogramowanie miałoby trudności z tyloma punktami?)
źródło
Widziałem podobną pracę wykonaną dla cen domów przy użyciu modelowania hedonicznego. Przykłady można znaleźć na stronie http://scholar.google.com/scholar?hl=pl&q=hedonic+price+geography .
źródło