Czy współrzędne GPS (szerokość i długość geograficzna) mogą być używane jako funkcje w modelu liniowym?

10

Mam zestawy danych, które zawierają, wśród wielu funkcji, współrzędne GPS (szerokość i długość geograficzna). Chciałbym użyć tych zestawów danych do zbadania problemów, takich jak: (1) obliczanie ETA w celu przejazdu między punktami początkowymi i końcowymi; oraz (2) oszacowanie liczby przestępstw dla określonego punktu.

Chciałbym użyć modelu regresji liniowej. Czy mogę jednak użyć tych współrzędnych GPS bezpośrednio w modelu liniowym?

Szerokość i długość geograficzna nie mają porządkowej własności , takiej jak wiek osoby. Na przykład dwa punkty (40.805996, -96.681473) i (41.226682, -95.986587) nie wydają się mieć żadnego znaczącego uporządkowania. Są tylko punktami w kosmosie. Zastanawiałem się nad zastąpieniem ich kategorycznymi kodami pocztowymi w USA, a następnie kodowaniem „na gorąco” , ale spowodowałoby to wiele zmiennych.

stackoverflowuser2010
źródło
1
Czy musisz z nich korzystać bezpośrednio ? Czy słyszałeś o narzędziach strefowych, takich jak algorytm AZP autorstwa S. Openshaw? Możesz nawet ręcznie oddzielić regiony na mapie, aby oddzielić regiony / strefy, jeśli obszar jest względnie spójny.
Mephy,
@Mephy: Oznaczałoby to konwersję lat / long na strefy, prawda? Ale wtedy miałbym setki lub tysiące strefowych kategorii, tak jak w przypadku kodów pocztowych. Musiałbym zakodować je wszystkie na gorąco.
stackoverflowuser2010
Oczywiście zależy od tego, jak przecinasz strefy. Jeśli wybierzesz „na południe od linii równikowej / na północ od linii równikowej”, to będą tylko dwa. Wiele algorytmów strefowania ma pewne hiper-parametry do definiowania wielkości, takich jak liczba stref lub minimalny rozmiar strefy.
Mephy,
Mam ten sam problem: chcę przewidzieć pozycję ludzi. Udostępniłem wszystkie funkcje geolokalizacji w danych treningowych. Następnie LabelDecoder służy do przekształcania jakościowej lokalizacji. Wreszcie wynik jest okropny. Czy jest jakiś dobry pomysł, aby poradzić sobie z prognozowaniem przestrzennym?
berisfu

Odpowiedzi:

5

Nie możesz ich użyć bezpośrednio, ponieważ jest mało prawdopodobne, aby istniała prawdziwa relacja liniowa, chyba że chcesz przewidzieć „jak daleko na wschód lub północ” jest ktoś. Jak wspomniano w komentarzach, musisz je przekształcić w strefy. Jeśli chcesz, aby było to naprawdę proste, możesz użyć algorytmu klastrowania kNN z małą liczbą potencjalnych klastrów, a następnie przypisać każdej instancji nową funkcję z identyfikatorem klastra, a następnie zakodować go jednym kodem.

Możesz także przeczytać o tym, jak ludzie interpolują współrzędne, aby przewidywać wartości na całej mapie. Pierwszy przykład dotyczy stacji temperatury, ale można również wyobrazić sobie, że są to „gorące strefy” przestępczości.

( DOCS )

CalZ
źródło
2

Możesz zrobić wszystko, czego zapragnie twoje serce, ale jeśli twój model nie przewiduje różnicy temperatur lub czasu, nie mogę wymyślić żadnej innej zmiennej docelowej, która zależy wyłącznie od współrzędnych.

To, co prawdopodobnie chcesz zrobić, to użyć zewnętrznego źródła danych i wzbogacić swoje dane o kraj / kod pocztowy / klimat / inne funkcje geograficzne, które pomogą w działaniu twojego modelu.

GregA
źródło
0

Współrzędne GPS można bezpośrednio przekonwertować na geohash . Geohash dzieli Ziemię na „wiadra” o różnej wielkości w zależności od liczby cyfr (krótkie kody Geohash tworzą duże obszary, a dłuższe kody dla mniejszych obszarów).

Geohash jest pojedynczą liczbą, która może być używana jako funkcja w modelu.

Geohash dotyczy tylko całego świata, a kody pocztowe nie.

Brian Spiering
źródło
Wyjście geohashera jest ciągiem, a nie pojedynczą liczbą, prawda? A jeśli geohash jest ciągiem, to musiałbym go zakodować na gorąco, co dałoby wiele zmiennych, tak jak w przypadku kodu pocztowego zakodowanego na gorąco.
stackoverflowuser2010
Geohash jest pojedynczą liczbą zakodowaną w bazie 32. Nie ma powodu, aby kodować 1-na gorąco. Wybierz poziom dokładności i użyj odpowiedniej liczby cyfr.
Brian Spiering
Widziałem tylko ciągi znaków geohashów. Jednak nawet jeśli geohashy były reprezentowane jako długie int, czy istnieje jakaś liniowa zależność między nimi do zastosowania w modelu liniowym? Właśnie o to chodzi w moim pierwotnym pytaniu.
stackoverflowuser2010
Związek między geohashami jest nieco złożony - en.wikipedia.org/wiki/Geohash#Design
Brian Spiering
1
Istnieje wiele sposobów inżynierii cech poza kodowaniem liniowym i jednorazowym. Na przykład sztuczka jądra lub transformacja Helmerta.
Brian Spiering,