Zamieszanie związane z normalizacją danych

9

Próbuję nauczyć się modelu regresji liniowej. Mam jednak pewne zamieszanie związane z normalizacją danych. Znormalizowałem cechy / predyktory do zera średniej i wariancji jednostkowej. Czy muszę zrobić to samo dla celu. Jeśli tak to dlaczego?

użytkownik34790
źródło
1
Dlaczego znormalizowałeś funkcje / predyktory?
Peter Flom
4
BTW myślę, że „standaryzacja” jest na to lepszym określeniem.
Scortchi - Przywróć Monikę

Odpowiedzi:

6

Normalizacja celu w regresji liniowej nie ma znaczenia. W regresji liniowej dopasowanie będzie miało postać Kiedy predyktory są wyśrodkowane, stały składnik zawsze będzie średnią . Więc jeśli wyśrodkujesz przed uruchomieniem regresji, otrzymasz po prostu , ale wszystkie pozostałe współczynniki pozostaną niezmienione.

y^i=a0+axi.
xiza0yjayjaza0=0

(To powiedziawszy, normalizacja predyktorów --- tak jak obecnie robisz --- jest dobrym pomysłem.)

Stefan Wager
źródło
1
Dlaczego normalizacja predyktorów to dobry pomysł?
Scortchi - Przywróć Monikę
@Stefan. Tak, kiedy centruję predyktory, otrzymuję stały który oznacza średnią y. Ale nie wiedziałem, dlaczego to się stało. Czy możesz mi powiedzieć matematykę? za0
user34790 21.04.13
2
@Scortchi Normalizacja predyktorów nie jest konieczna, ale może ułatwić interpretację współczynników regresji: Po normalizacji duże współczynniki odpowiadają ważnym predyktorom. Ponadto bez normalizacji współczynniki warunków interakcji mogą być bardzo mylące. To powiedziawszy, normalizacja nie wpłynie na prognozy uzyskane z modelu, więc normalizacja ma znaczenie tylko wtedy, gdy zamierzasz interpretować współczynniki w regresji.
Stefan Wager
1
@ user34790 Matematyka jest opracowywana na pmean.com/10/LeastSquares.html
Stefan Wager