Wartości zerowe w analizie regresji ważonej geograficznie

12

Niektóre z moich zmiennych objaśniających mają kilka wartości zerowych dla niektórych wielokątów.

Czy analiza regresji ważonej geograficznie może sobie z tym poradzić, czy też powinienem usunąć cały wielokąt i wszystkie dane (zmienne zależne i niezależne dla tego konkretnego wielokąta)?

I Heart Beats
źródło
Co oznaczają te wartości zerowe? Czy wartość nie ma zastosowania lub istnieje, ale jest nieznana? Jeśli to drugie, dlaczego nie jest znane? (Głównym problemem jest to, czy przyczyna nieznanej wartości jest w jakikolwiek sposób związana z samą wartością; na przykład, jeśli studiujesz hydrologię i używasz pokrycia terenu jako zmiennej wyjaśniającej, to jeśli pokrycie terenu jest nieznane z powodu powodzi, to ważna informacja i oznacza znacznie więcej niż tylko brakującą wartość.)
whuber
1
Dziękuję Whuber, Niektóre z null reprezentują dane, które zostały pominięte ze względu na małe jednostki agregacji, inne były po prostu niedostępne, ale nie w wyniku zmiennych objaśniających wpływających na inne zmienne. Mam prawdziwe wartości zerowe, przy czym zero reprezentuje brak zdarzenia / częstotliwości dla tego konkretnego wielokąta, a także mam pewne wartości zerowe, w których brakuje danych. Ponieważ mam na początek około 29 zmiennych objaśniających, jeśli wyjmę wielokąty, w których dla wierszy zawierających wartości zerowe tracę 8 wielokątów z 279 i miałem nadzieję, że nie będę musiał. Dziękuję Ci!
I Heart Beats
Cieszę się, że masz informacje i teorie na temat zaginięcia. Możesz być nieco ostrożny w stosunku do tych małych jednostek, ponieważ wartości niemal każdej zmiennej mogą być prawdopodobnie powiązane z rozmiarem regionu, który reprezentuje, tworząc w ten sposób potencjalne odchylenie we wzorze braków.
whuber
2
Możesz włączyć wartości null, wprowadzając zmienne wskazujące na ich obecność i kodując wszystkie oryginalne wyniki null o wspólnej wartości (która wartość nie ma znaczenia). Będziesz potrzebował jednego oddzielnego wskaźnika dla każdej zmiennej zawierającej wartości null. Cokolwiek zrobisz, nie zastępuj zer zerami zerami (lub innymi stałymi)! Wartość null oznacza coś zupełnie innego niż zero.
whuber
1
@whuber Wygląda na to, że w twoich komentarzach może być wystarczająco dużo, aby napisać odpowiedź na ten temat.
PolyGeo

Odpowiedzi:

1

Możesz spróbować zgadnąć wartości „null” z otaczających danych. To byłoby lepsze niż ich pominięcie, ponieważ w ten sposób nie stracisz danych. Oczywiście musisz być ostrożny w zgadywaniu wartości. Ponieważ jeśli twoje przypuszczenia są stronnicze, twój model również będzie.

patrz także: http://handbook.cochrane.org/chapter_16/16_1_2_general_principles_for_dealing_with_missing_data.htm

i:

Uwaga:

Używając plików kształtów, pamiętaj, że nie mogą przechowywać wartości zerowych. Narzędzia lub inne procedury, które tworzą pliki shapefile na podstawie danych wejściowych niehapefile, mogą w konsekwencji przechowywać wartości zerowe jako zero lub jako bardzo małą liczbę ujemną (-DBL_MAX = -1,7976931348623158e + 308). Może to prowadzić do nieoczekiwanych rezultatów. Zobacz także: Uwagi na temat przetwarzania geoprzestrzennego dla danych wyjściowych pliku kształtu. ( http://desktop.arcgis.com/en/arcmap/10.3/tools/spatial-statistics-toolbox/geographically-weighted-regression.htm )

LMB
źródło