Modelowanie cen czynszu - jakiej metody interpolacji użyć?

13

Mam krajowy zbiór danych ~ 1,4 miliona gospodarstw domowych. Tam mam informacje na temat czynszu, wielkości (liczby pokoi i m2) oraz niektórych dodatkowych cech każdego gospodarstwa domowego.

Chciałbym wykorzystać te dane do stworzenia powierzchni cen czynszów dla całego kraju i wykorzystać te informacje jako przybliżenie do oszacowania wartości pozostałych ~ 1,5 miliona gospodarstw domowych, które są własnością lub nie mają informacji o czynszach.

Kilka pytań tutaj:

Czy takie podejście jest w ogóle odpowiednie dla tego rodzaju problemu?

Którą metodę interpolacji najlepiej tu zastosować?

Czy można również wziąć pod uwagę informacje, na przykład o wielkości gospodarstwa domowego?

Korzystam z ArcGIS 9.3 z licencją ArcInfo.

radek
źródło
1
Wygląda na to, że systemy CAMA (Computer Aided Mass Apprais) musiałyby zrobić coś podobnego. Zastanawiam się, jak sobie z tym radzą. en.wikipedia.org/wiki/Computer_Assisted_Mass_Appraisal
Kirk Kuykendall

Odpowiedzi:

10

Pomysł jest dobry, ale proponowane wdrożenie może być zbyt uproszczone, aby było wiarygodne. Czynsze są własnością systemów ekonomicznych. Poza wpływem lokalizacji są one powiązane z innymi zmiennymi ekonomicznymi w istotny sposób: stan lokalnej (i krajowej) gospodarki, lokalne ceny mieszkań, dostępność kapitału, wskaźniki zatrudnienia itp. Aby wykonać dobrą pracę, potrzebujesz modelu ekonometrycznego . Korzystne może być stosowanie pewnych terminów opóźnień przestrzennych , ale zanim takie komplikacje zostaną rozważone, należy uwzględnić wiele z tych współzmiennych ekonomicznych.

Powiedziawszy to, twoja zdolność do sukcesu zależy od relacji między twoimi danymi, a czynszami, które chcesz przewidzieć. Jeśli twoje dane są reprezentatywną próbką z całego kraju i są rozproszone geograficznie - pomyśl o domach jak rodzynkach na ciasteczku, a masz dane o wszystkich innych rodzynkach w ciasteczku - wtedy stosunkowo prosty model może wystarczyć. Jeśli Twoje dane są zorientowane geograficznie - być może masz informacje o rodzynkach po prawej stronie pliku cookie i chcesz przewidzieć rodzynki po lewej stronie - problem jest trudniejszy.

Dobrym punktem wyjścia byłoby dopasowanie konwencjonalnego liniowego modelu ekonometrycznego czynszów do cech gospodarstw domowych i cech przestrzennych brutto (takich jak polityka podatkowa państwa lub powiatu), obliczenie reszt i rozpoczęcie eksploracji przestrzennej (za pomocą wariografii , przestrzennych wygładzeń jądra itp.), aby uchwycić efekty geograficzne.

Odpowiednie oprogramowanie jest dostępne jako dodatki do R .

Whuber
źródło
@whubber Link do dokumentu opisującego wariografię wydaje się martwy. Czy jest szansa na aktualizację?
radek
1
Dzięki, @radek. Zaskakująco trudno jest znaleźć prezentację wariografii w Internecie, która jest wprowadzająca, ale dokładna i nie jest tylko instrukcją oprogramowania. Znalazłem ostatnią rozprawę doktorską, która - sądząc z jej streszczenia i wstępu - wydaje się jasna i dokładna i zaczyna się od względnie elementarnego punktu.
whuber
7

Jako bardzo łagodne wprowadzenie do tematów dotyczących regresji przestrzennej gorąco polecam sprawdzenie skoroszytu GeoDa (rozdziały 22–25 będą najbardziej interesujące). Nawet jeśli nie chcesz korzystać z oprogramowania, jest to bardzo kompleksowy przegląd regresji przestrzennej.

Czy wbudowane funkcje regresji w ArcMap poradzą sobie z tak dużą ilością danych (nie to, że żadne oprogramowanie miałoby trudności z tyloma punktami?)

Andy W.
źródło
3
(+1) 1,4 miliona punktów nie stanowi problemu dla regresji. (Na przykład wysiłek w algorytmach najmniejszych kwadratów jest zwykle proporcjonalny do sześcianu liczby zmiennych. Konfigurowanie równań wymaga tylko jednego szybkiego skanowania zestawu danych.) Prawdziwy problem polega na tym, że 1,4 miliona przypadków będzie zawierało bogaty i szczegółowa struktura: dobra analiza byłaby niezwykle pracochłonna. (Jestem pewien, że ten zestaw danych mógłby wygenerować mnóstwo prac doktorskich z ekonomii). Dlatego sztuczką jest wykonanie tyle pracy, ile potrzeba, aby uzyskać wystarczająco dokładne i możliwe do obrony odpowiedzi na dane zadanie.
whuber
3

Widziałem podobną pracę wykonaną dla cen domów przy użyciu modelowania hedonicznego. Przykłady można znaleźć na stronie http://scholar.google.com/scholar?hl=pl&q=hedonic+price+geography .

Ian Turton
źródło
2
(+1) Zgadzam się, że literatura na temat hedonicznych modeli wyceny domów ma w dużej mierze zastosowanie do tego pytania. Odmówiłem jednak sugerowania tego, ponieważ osoba, która nie jest obeznana z regresją, może zniechęcić pracę wszystkich ekonometrów (wiem, że czasami to robię!). Teoria jest mądra, chociaż warto sprawdzić literaturę, szczególnie w przypadku zmiennych towarzyszących zainteresowań.
Andy W