W jakich okolicznościach chciałbyś skalować lub standaryzować zmienną przed dopasowaniem modelu? A jakie są zalety / wady skalowania zmiennej?
56
W jakich okolicznościach chciałbyś skalować lub standaryzować zmienną przed dopasowaniem modelu? A jakie są zalety / wady skalowania zmiennej?
Odpowiedzi:
Standaryzacja polega na wadze różnych zmiennych dla modelu. Jeśli wykonasz standaryzację „tylko” ze względu na stabilność numeryczną, mogą wystąpić transformacje, które dają bardzo podobne właściwości liczbowe, ale inne znaczenie fizyczne, które może być znacznie bardziej odpowiednie do interpretacji. To samo dotyczy centrowania, które zwykle stanowi część normalizacji.
Sytuacje, w których prawdopodobnie chcesz standaryzować:
Sytuacje, w których możesz nie chcieć standaryzować:
Możesz zrobić coś „pomiędzy” i przekształcić zmienne lub wybrać jednostkę, aby nowe zmienne nadal miały fizyczne znaczenie, ale zmiana wartości liczbowej nie jest tak różna, np.
Podobne do centrowania:
źródło
Przed standaryzacją zawsze zadaję sobie pytanie: „Jak zinterpretuję wynik?” Jeśli istnieje sposób analizy danych bez transformacji, może to być preferowane wyłącznie z punktu widzenia interpretacji.
źródło
Ogólnie nie polecam skalowania ani standaryzacji, chyba że jest to absolutnie konieczne. Zaletą lub atrakcyjnością takiego procesu jest to, że gdy zmienna objaśniająca ma zupełnie inny wymiar fizyczny i wielkość niż zmienna odpowiedzi, skalowanie przez podział przez odchylenie standardowe może pomóc pod względem stabilności numerycznej i umożliwia porównanie efektów na wielu wyjaśniające zmienne. Przy najbardziej powszechnej standaryzacji efekt zmienny jest wielkością zmiany zmiennej odpowiedzi, gdy zmienna objaśniająca wzrasta o jedno odchylenie standardowe; wskazuje również, że znaczenie efektu zmiennego (wielkość zmiany zmiennej odpowiedzi, gdy zmienna objaśniająca wzrośnie o jedną jednostkę) zostałaby utracona, chociaż wartość statystyczna dla zmiennej objaśniającej pozostaje niezmieniona. Jednak, gdy rozważa się interakcję w modelu, skalowanie może być bardzo problematyczne nawet w przypadku testów statystycznych z powodu komplikacji obejmującej stochastyczną korektę skalowania w obliczaniu standardowego błędu efektu interakcji (Preacher, 2003). Z tego powodu skalowanie według odchylenia standardowego (lub standaryzacji / normalizacji) zasadniczo nie jest zalecane, szczególnie w przypadku interakcji.
Preacher, KJ, Curran, PJ i Bauer, DJ, 2006. Narzędzia obliczeniowe do sondowania efektów interakcji w wielu regresji liniowej, modelowaniu wielopoziomowym i analizie krzywej utajonej. Journal of Educational and Behavioral Statistics, 31 (4), 437-448.
źródło