Zastosowanie predyktorów kołowych w regresji liniowej

19

Próbuję dopasować model, wykorzystując dane wiatru (0, 359) i porę dnia (0, 23), ale martwię się, że źle pasują one do regresji liniowej, ponieważ same nie są parametrami liniowymi. Chciałbym je przekształcić za pomocą Pythona. Widziałem wzmiankę o obliczaniu wektora przez wzięcie grzechu i cos stopni, przynajmniej w przypadku wiatru, ale nie za dużo.

Czy istnieje biblioteka Python lub odpowiednia metoda, która może być pomocna?

compguy24
źródło
1
Dziękujemy za zadawanie tego pytania. Zauważ, że pytanie o kod lub biblioteki jest nie na temat (większość twojego pytania z pewnością dotyczy tematu), więc ten aspekt może, ale nie musi być objęty tutaj odpowiedziami.
Gung - Przywróć Monikę
Jaka jest tutaj zmienna odpowiedzi (wynik, zmienna zależna)? Czy kierunek wiatru i pora dnia są jednocześnie predyktorami?
Nick Cox,
@NickCox Tak, zarówno kierunek wiatru, jak i pora dnia są predyktorami. Wynikiem jest liczba całkowita reprezentująca stężenie cząstek (zanieczyszczenie powietrza). Są też inne predyktory, w tym temperatura, wilgotność itp. ... ale nie trzeba ich przekształcać, jak sądzę.
compguy24
1
Pozwoliłem sobie na edycję tytułu. Poprzedni tytuł „Liniowy rozkład stopni wokół koła” moim zdaniem w ogóle nie uchwycił pytania.
Nick Cox

Odpowiedzi:

24

Kierunek wiatru (tutaj mierzony w stopniach, prawdopodobnie jako kierunek kompasu zgodny z ruchem wskazówek zegara od północy) jest zmienną kołową. Test polega na tym, że konwencjonalny początek skali jest taki sam jak koniec, tj. . Gdy jest traktowany jako predyktor, najlepiej jest przyporządkować go do sinusa i cosinusa. Niezależnie od używanego oprogramowania, można oczekiwać, że kąty będą mierzone w radianach, więc konwersja będzie w pewnym stopniu równoważna0=360

grzech(π kierunek/180),sałata(π kierunek/180)

2)π=360

grzech(π czas/12),sałata(π czas/12)

lub

grzech(π(czas+0,5)/12),sałata(π(czas+0,5)/12)

w zależności od tego, jak dokładnie czas został zarejestrowany lub powinien być interpretowany.

Czasami natura lub społeczeństwo jest zobowiązujące, a zależność od zmiennej kołowej przyjmuje postać pewnego kierunku, który jest optymalny dla odpowiedzi, a przeciwny kierunek (połowa koła) jest pesymalny. W takim przypadku wystarczy jeden termin sinus i cosinus; w przypadku bardziej skomplikowanych wzorów możesz potrzebować innych terminów. O wiele bardziej szczegółowo tutorial na tej techniki kołowej, Fouriera, okresowego, trygonometryczne regresji można znaleźć tutaj , z kolei w dalszych odniesień. Dobra wiadomość jest taka, że ​​po utworzeniu warunków sinus i cosinus są one dodatkowymi predyktorami w regresji.

Istnieje duża literatura na temat statystyki kołowej, która sama w sobie jest postrzegana jako część statystyki kierunkowej. Co dziwne, technika ta często nie jest wspomniana, ponieważ literatura koncentruje się zwykle na zmiennych odpowiedzi kołowej. Podsumowanie zmiennych kołowych za pomocą ich wektorów jest standardową metodą opisową, ale nie jest wymagane ani bezpośrednio pomocne w regresji.

Niektóre szczegóły terminologii Kierunek wiatru i pora dnia są w ujęciu statystycznym zmiennymi, a nie parametrami, niezależnie od zastosowania w twojej dziedzinie nauki.

yXββX[-1,1]

Przypadkowy komentarz W przypadku zmiennej odpowiedzi, takiej jak stężenie cząstek, spodziewałbym się, że zastosuję uogólniony model liniowy z łączem logarytmicznym w celu zapewnienia pozytywnych prognoz.

Nick Cox
źródło