Cześć chłopaki, znalazłem jeden lub dwa artykuły, które używają regresji grzbietu (dla danych koszykówki). Zawsze kazano mi ustandaryzować moje zmienne, jeśli prowadziłem regresję grzbietu, ale po prostu kazano mi to zrobić, ponieważ grzbiet był wariantem skali (regresja grzbietu nie była tak naprawdę częścią naszego kursu, więc nasz wykładowca przejrzał ją).
Te artykuły, które przeczytałem, nie ustandaryzowały ich zmiennych, co trochę mnie zaskoczyło. Skończyły się one również dużymi wartościami lambda (około poziomu 2000–4000) poprzez krzyżową walidację, a powiedziano mi, że wynika to z braku standaryzacji zmiennych.
W jaki sposób pozostawienie niestandardowej zmiennej (zmiennych) prowadzi do wysokich wartości lambda, a także jakie są konsekwencje braku standaryzacji zmiennych w ogóle? Czy to naprawdę taka wielka sprawa?
Każda pomoc jest mile widziana.
źródło
Choć cztery lata później, mam nadzieję, że ktoś skorzysta na tym .... W moim rozumieniu, coeff jest to, ile zmian zmiennej docelowej dla zmiany jednostkowej zmiennej niezależnej (dy / dx). Załóżmy, że badamy związek między wagą a wzrostem, a waga jest mierzona w kg. Kiedy używamy Kilometrów do wysokości, możesz sobie wyobrazić, że większość punktów danych (dla wysokości człowieka) jest ściśle upakowana. Tak więc, dla niewielkiej ułamkowej zmiany wysokości nastąpi ogromna zmiana masy (zakładając wzrost masy wraz z wzrostem). Stosunek dy / dx będzie ogromny. Z drugiej strony, jeśli wysokość jest mierzona w milimetrach, dane będą rozłożone daleko i szeroko na atrybutach wysokości. Zmiana wysokości w jednostce nie spowoduje znaczącej zmiany masy dy / dx będzie bardzo mała, prawie bliska 0.
źródło