Obecnie biorę swoją pierwszą stosowaną klasę regresji liniowej na poziomie magisterskim i walczę z transformacjami zmiennych predykcyjnych w wielokrotnej regresji liniowej. Tekst, którego używam, Kutner i in. „Stosowane liniowe modele statystyczne” wydaje się nie obejmować mojego pytania. (oprócz sugerowania, że istnieje metoda Box-Coxa do transformacji wielu predyktorów).
W obliczu zmiennej odpowiedzi i kilku zmiennych predykcyjnych, jakie warunki dąży się do spełnienia każdej zmiennej predykcyjnej? Rozumiem, że ostatecznie szukamy stałości wariancji błędów i błędów normalnie rozłożonych (przynajmniej w technikach, których byłem do tej pory nauczony). Wróciłem wiele ćwiczeń, gdzie rozwiązaniem było, na przykład y ~ x1 + (1/x2) + log(x3)
, gdzie jeden lub więcej predyktorów zostało przekształconych.
Zrozumiałem uzasadnienie prostej regresji liniowej, ponieważ łatwo było spojrzeć na y ~ x1 i powiązaną diagnostykę (wykresy qq reszt, reszty vs y, reszty vs x itp.) I przetestować, czy y ~ log ( x1) lepiej pasuje do naszych założeń.
Czy jest dobre miejsce, aby zacząć rozumieć, kiedy przekształcić predyktor w obecności wielu predyktorów?
Z góry dziękuję. Matt