Pracuję nad fikcyjnym zestawem danych z 25 funkcjami. Dwie cechy to szerokość i długość geograficzna miejsca, a inne to wartości pH, wysokość, prędkość wiatru itp. O różnych zakresach. Mogę przeprowadzić normalizację innych funkcji, ale jak podejść do funkcji szerokości / długości geograficznej?
Edycja: Jest to problem przewidujący plony z rolnictwa. Myślę, że długość / długość jest bardzo ważna, ponieważ lokalizacje mogą mieć kluczowe znaczenie w przewidywaniu, a zatem i dylemacie.
machine-learning
python
feature-engineering
feature-scaling
normalization
AllThingsScience
źródło
źródło
Odpowiedzi:
Współrzędne Lat Long mają problem polegający na tym, że są to 2 elementy reprezentujące trójwymiarową przestrzeń. Oznacza to, że długa współrzędna biegnie dookoła, co oznacza, że dwie skrajne wartości są w rzeczywistości bardzo blisko siebie. Poradziłem sobie z tym problemem kilka razy, a tym, co robię w tym przypadku, jest mapowanie ich na współrzędne x, yiz. Oznacza to, że bliskie punkty w tych 3 wymiarach są również blisko w rzeczywistości. W zależności od przypadku użycia możesz zignorować zmiany wysokości i odwzorować je na idealną kulę. Funkcje te można następnie odpowiednio ustandaryzować.
Aby to wyjaśnić (podsumowane w komentarzach):
źródło