Pracując nad problemem regresji, zacząłem myśleć o przedstawieniu funkcji „dzień tygodnia”. Zastanawiam się, które podejście działałoby lepiej:
- jedna cecha; wartość 1/7 dla poniedziałku; 2/7 na wtorek ...
- 7 funkcji: (1, 0, 0, 0, 0, 0, 0) na poniedziałek; (0, 1, 0, 0, 0, 0, 0) na wtorek ...
Trudno to zmierzyć z powodu różnic w konfiguracji sieci. (Wierzę, że dodatkowe sześć funkcji powinno znaleźć odzwierciedlenie w liczbie ukrytych węzłów).
Liczba wszystkich funkcji wynosi około 20. Korzystam z prostego backpropu, aby nauczyć się zwykłej sieci neuronowej z przekazywaniem danych.
Odpowiedzi:
Druga reprezentacja jest bardziej tradycyjna dla zmiennych jakościowych, takich jak dzień tygodnia.
Jest to również znane jako tworzenie zmiennych zastępczych i jest szeroko stosowaną metodą kodowania zmiennych kategorialnych. Jeśli użyłeś kodowania 1-7, mówisz modelowi, że dni 4 i 5 są bardzo podobne, podczas gdy dni 1 i 7 są bardzo odmienne. W rzeczywistości dni 1 i 7 są tak samo podobne jak dni 4 i 5. Ta sama logika obowiązuje dla kodowania 0-30 dla dni miesiąca.
Dzień miesiąca jest nieco trudniejszy, ponieważ chociaż każdy tydzień ma te same 7 dni, nie każdy miesiąc ma te same 30 dni: niektóre miesiące mają 31 dni, a niektóre miesiące 28. Ponieważ zarówno tygodnie, jak i miesiące są cykliczne, można użyć transformacji Fouriera do przekształcenia ich w gładkie zmienne liniowe.
Na przykład ( używając R, mojego wybranego języka programowania ):
(Przeskalowałem zmienne sinus / cosinus do 0/30, zamiast -1/1, więc wykres wygląda lepiej)
Jak widać, podczas gdy surowa „zmienna dnia miesiąca” przeskakuje z powrotem na zero na koniec każdego miesiąca, transformacje sinus i cosinus tworzą płynne przejście, które pozwala modelowi wiedzieć, że dni na koniec jednego miesiąca są podobne do dni na początku następnego miesiąca.
Możesz dodać resztę czterech terminów w następujący sposób:
Każda para fal sinusoidalnych / cosinusowych tworzy koło:
Ta strona zawiera naprawdę przydatne wyjaśnienie, jak manipulować falami sinusoidalnymi i cosinusowymi.
źródło