Ogólnie zastanawiam się, czy kiedykolwiek lepiej nie używać ortogonalnych wielomianów podczas dopasowywania regresji do zmiennych wyższego rzędu. W szczególności zastanawiam się nad użyciem R:
Jeśli poly()
z raw = FALSE
produkuje te same wartości, montowany poly()
z raw = TRUE
oraz poly
z raw = FALSE
rozwiązuje niektóre z problemów związanych z wielomianowej regresji, to należy poly()
z raw = FALSE
zawsze być stosowany do montażu wielomianowych regresji? W jakich okolicznościach lepiej nie używać poly()
?
źródło
Ponieważ jeśli Twój model opuszcza R, gdy dorośnie, musisz pamiętać o spakowaniu stałych centrowania i normalizacji, a następnie musi je ciągnąć przez cały czas. Wyobraź sobie, że pewnego dnia natkniesz się na to, zakodowane w SQL, i przerażenie, że zrozumiałem, że to ich źle wprowadziło!
źródło