Wsteczna transformacja współczynników regresji

17

Wykonuję regresję liniową z transformowaną zmienną zależną. Dokonano następującej transformacji, aby utrzymać założenie normalności reszt. Nietransformowana zmienna zależna została ujemnie wypaczona, a następująca transformacja zbliżyła ją do normy:

Y=50Yorig

gdzie jest zmienną zależną w oryginalnej skali.Yorig

Myślę, że warto zastosować transformację współczynników aby wrócić do oryginalnej skali. Używając następującego równania regresji,β

Y=50Yorig=α+βX

i ustalając , mamyX=0

α=50Yorig=50αorig

I w końcu,

αorig=50α2

Za pomocą tej samej logiki znalazłem

βorig=α (α2β)+β2+αorig50

Teraz wszystko działa bardzo dobrze dla modelu z 1 lub 2 predyktorami; współczynniki przekształcone wstecznie przypominają oryginalne, tylko teraz mogę zaufać standardowym błędom. Problem pojawia się, gdy dołączasz termin interakcji, taki jak

Y=α+X1βX1+X2βX2+X1X2βX1X2

Wówczas transformacja wsteczna dla β nie jest tak bliska tym z oryginalnej skali i nie jestem pewien, dlaczego tak się dzieje. Nie jestem również pewien, czy formuła znaleziona dla wstecznej transformacji współczynnika beta jest użyteczna, tak jak dla 3rd β (dla terminu interakcji). Zanim poszedłem do szalonej algebry, pomyślałem, że poproszę o radę ...

Dominic Comtois
źródło
Jak definiujesz i ? β o r i gαorigβorig
mark999
Jako wartość alfa i beta w oryginalnych skalach
Dominic Comtois,
1
Ale co to znaczy?
mark999
Zaryzykowałbym coś takiego: szacunki, które otrzymalibyśmy, to oryginalne dane dostosowane do regresji liniowej.
Dominic Comtois,
2
Wydaje mi się, że to bezsensowna koncepcja. Zgadzam się z odpowiedzią Gunga.
mark999

Odpowiedzi:

19

Jednym z problemów jest to, że napisałeś

Y=α+βX

Jest to prosty deterministyczny (tj. Nieprzypadkowy) model. W tym przypadku, mógłby z powrotem przekształcić współczynniki na oryginalnej skali, ponieważ jest to tylko kwestia jakiejś prostej algebry. Ale w zwykłej regresji masz tylko ; termin błędu został usunięty z modelu. Jeśli przemiana z Y powrotem do Y o R ı g nieliniowy może mieć problem, ponieważ , w ogóle. Myślę, że może to mieć związek z widoczną rozbieżnością.E(Y|X)=α+βXYYorigE(f(X))f(E(X))

Edycja: Zauważ, że jeśli transformacja jest liniowa, możesz przekształcić ją wstecz, aby uzyskać oszacowania współczynników na oryginalnej skali, ponieważ oczekiwanie jest liniowe.

Makro
źródło
4
+1 za wyjaśnienie, dlaczego nie możemy z powrotem przekształcić bety.
Gung - Przywróć Monikę
15

Pozdrawiam wasze wysiłki tutaj, ale szczekasz na złe drzewo. Nie cofniesz transformacji bety. Twój model utrzymuje się w przekształconym świecie danych. Jeśli chcesz dokonać prognozy, na przykład, z powrotem przekształcić pręd I , ale to wszystko. Oczywiście można również uzyskać przedział predykcji, obliczając wartości górnego i dolnego limitu, a następnie również je przekształcić, ale w żadnym wypadku nie przekształca się ponownie bet. y^i

gung - Przywróć Monikę
źródło
1
Co zrobić z faktem, że współczynniki przekształcone wstecznie zbliżają się bardzo do współczynników uzyskanych podczas modelowania nietransformowanej zmiennej? Czy to nie pozwala na pewne wnioskowanie na oryginalnej skali?
Dominic Comtois,
2
Nie wiem dokładnie. Może zależeć od dowolnej liczby rzeczy. Moje pierwsze przypuszczenie jest takie, że masz szczęście z pierwszą betą, ale potem twoje szczęście się kończy. Muszę się zgodzić z w / @ mark999, że „szacunki, które otrzymalibyśmy, to oryginalne dane dostosowane do regresji liniowej”, w rzeczywistości nie mają żadnego sensu; Chciałbym, żeby tak było i wydaje się, że na pierwszy rzut oka się rumieni, ale niestety tak nie jest. I nie licencjonuje żadnych wniosków w oryginalnej skali.
Gung - Przywróć Monikę
1
@ gung dla transformacji nieliniowych (powiedzmy box cox): Mogę przekształcić dopasowane wartości, a także przedziały prognozowania, ale nie mogę przekształcić bet ani przedziałów współczynników dla bet. Czy są jakieś dodatkowe ograniczenia, o których powinienem wiedzieć? btw, to bardzo interesujący temat, gdzie mogę uzyskać lepsze zrozumienie?
mugen
2
@mugen, trudno powiedzieć, o czym jeszcze powinieneś wiedzieć. Jedną rzeczą, o której warto pamiętać, jest to, że transformacja pleców y-hat daje warunkową medianę, podczas gdy nieodwracalna (cętkowana) y-hat jest średnią warunkową. Poza tym materiał ten powinien być ujęty w dobrym podręczniku regresji.
gung - Przywróć Monikę
3
@mugen, nie ma za co. Możesz zadawać więcej pytań za pomocą normalnych mechanizmów (klikanie ASK QUESTION); będzie więcej zasobów do odpowiedzi, zwrócisz uwagę CVerów, a informacje będą łatwiej dostępne dla potomnych.
gung - Przywróć Monikę