Sposoby radzenia sobie z funkcją długości / szerokości geograficznej [zamknięte]

19

Pracuję nad fikcyjnym zestawem danych z 25 funkcjami. Dwie cechy to szerokość i długość geograficzna miejsca, a inne to wartości pH, wysokość, prędkość wiatru itp. O różnych zakresach. Mogę przeprowadzić normalizację innych funkcji, ale jak podejść do funkcji szerokości / długości geograficznej?

Edycja: Jest to problem przewidujący plony z rolnictwa. Myślę, że długość / długość jest bardzo ważna, ponieważ lokalizacje mogą mieć kluczowe znaczenie w przewidywaniu, a zatem i dylemacie.

AllThingsScience
źródło
Czy możesz wyjaśnić, dlaczego nie uważasz, że możesz znormalizować te funkcje? Przypuszczalnie są one takie same jak inne funkcje, więc możesz wziąć średnią / SD? Czy martwisz się o naturalną miarę odległości między lokalizacjami? Jeśli tak, to czy dane obejmują niewielki obszar (o podobnych wartościach) czy globalne?
Neil Slater,
@NeilSlater Po prostu intuicyjnie nie ma sensu normalizować tych funkcji. Czy informacje nie zostaną utracone, jeśli zostaną znormalizowane? Mam zbiór danych obejmujący hrabstwa Ameryki.
AllThingsScience
Jak myślisz, jakie informacje zostaną utracone? Prawdopodobnie nie zostanie utracony, ale jeśli wyjaśnisz w swoim pytaniu, na czym polega Twoja obawa, ktoś będzie w stanie odpowiedzieć. Nie wiedząc już więcej, po prostu normalizuję niezależnie - dla pełnych globalnych wartości i niektórych problemów (gdzie ważna jest odległość między punktami) mógłbym utworzyć trójwymiarową kartezjańską funkcję współrzędnych z długiego / prostego.
Neil Slater,
Jakie jest twoje pytanie tutaj? Czego próbujesz dowiedzieć się na podstawie danych? Korelacja? Grupowanie? Klasyfikacja? Prognoza? Interpolacja? Jak ważna jest lokalizacja dla twojego modelu?
Spacedman,
@Spacedman Zobacz edycję.
AllThingsScience

Odpowiedzi:

24

Współrzędne Lat Long mają problem polegający na tym, że są to 2 elementy reprezentujące trójwymiarową przestrzeń. Oznacza to, że długa współrzędna biegnie dookoła, co oznacza, że ​​dwie skrajne wartości są w rzeczywistości bardzo blisko siebie. Poradziłem sobie z tym problemem kilka razy, a tym, co robię w tym przypadku, jest mapowanie ich na współrzędne x, yiz. Oznacza to, że bliskie punkty w tych 3 wymiarach są również blisko w rzeczywistości. W zależności od przypadku użycia możesz zignorować zmiany wysokości i odwzorować je na idealną kulę. Funkcje te można następnie odpowiednio ustandaryzować.

Aby to wyjaśnić (podsumowane w komentarzach):

x = cos(lat) * cos(lon)
y = cos(lat) * sin(lon), 
z = sin(lat) 
Jan van der Vegt
źródło
1
To jest bardzo interesujące. Dziękuję Ci! Czy możesz potwierdzić, czy są to formuły do ​​konwersji? x = R * cos (lat) * cos (lon), y = R * cos (lat) * sin (lon), z = R * sin (lat)
AllThingsScience
W tej chwili nie mam dostępu do mojego kodu, ale wygląda dobrze. Nie potrzebujesz R, ponieważ i tak będziesz się normalizować;)
Jan van der Vegt,
Doskonały! Dziękuję Ci.
AllThingsScience