Jak interpretować współczynniki regresji, gdy odpowiedź została przekształcona przez 4. pierwiastek?

20

Używam czwartej 1/4transformacji mocy root ( ) na mojej zmiennej odpowiedzi, w wyniku heteroscedastyczności. Ale teraz nie jestem pewien, jak interpretować moje współczynniki regresji.

Zakładam, że musiałbym przestawić współczynniki na czwartą potęgę podczas transformacji wstecznej (patrz poniżej dane wyjściowe regresji). Wszystkie zmienne wyrażone są w jednostkach dolara w milionach, ale chciałbym poznać zmianę dolara w miliardach.

Utrzymując inną niezależną zmienną stałą, zmiana opłat wynosząca średnio miliard dolarów prowadzi do zmiany 32kolekcji (lub 32 000 dolarów). Biorę 0.000075223 * 1000(aby dostać się do miliardów) ^ 4 = 0.000032. Czy teraz pomnożę tę liczbę przez 1 milion lub 1 miliard (pierwotna jednostka zmiennej zależnej jest w milionach)?

lm(formula = (Collections^(1/4)) ~ Fees + DIR)

                 Estimate      Std. Error  t value            Pr(>|t|)
(Intercept)   2.094573355     0.112292375   18.653  0.0000000000000151
Fees        **0.000075223   **0.000008411    8.943  0.0000000131878713
DIR           0.000022279     0.000004107    5.425  0.0000221138881913
użytkownik13968
źródło
4
Możesz przeczytać to: współczynniki transformacji wstecznej regresji .
gung - Przywróć Monikę

Odpowiedzi:

24

Najlepszym rozwiązaniem jest na początku wybranie wyrażenia zwrotnego, które ma znaczenie w dziedzinie studiów.

(Na przykład, gdy cofa się masy ciała na czynniki niezależne, to jest prawdopodobne, że albo korzenia kostki ( moc) lub pierwiastek kwadratowy ( 1 / 2 będą wskazane zasilania). Stwierdzając, że ciężar jest dobre przybliżenie do objętości sześcianu główny jest długość co stanowi charakterystyczną wielkość liniowy nadaje mu intuicyjnie potencjalnie interpretacji sposób Chociaż sama pierwiastek kwadratowy ma taką jasną interpretację, że znajduje się w pobliżu., 2 / 3, moc, która ma wymiary powierzchni : to może odpowiadać całkowitej powierzchni skóry).1/31/22/3

Czwarta moc jest wystarczająco bliska logarytmowi, że powinieneś rozważyć użycie logu , którego znaczenie jest dobrze zrozumiane. Ale czasami naprawdę okazuje się, że pierwiastek sześcienny lub pierwiastek kwadratowy lub jakaś taka ułamkowa moc wykonuje świetną robotę i nie ma oczywistej interpretacji. Następnie musimy wykonać trochę arytmetyki.

Przedstawiony w pytaniu model regresji obejmuje zmienną zależną („Kolekcje”) i dwie zmienne niezależne X 1 („Opłaty”) i X 2 („DIR”). To zakładaYX1X2

Y1/4=β0+β1X1+β2X2+ε.

Kod szacuje jako b 0 = 2,094573355 , β 1 jako b 1 = 0,000075223 , a β 2 jako b 2 = 0,000022279 . Zakłada również, że ε są normalne ze średnią zerową i szacuje ich wspólną wariancję (nie pokazano). Z tych szacunków, wyposażona wartość Y 1 / 4 jestβ0b0=2.094573355β1b1=0.000075223β2b2=0.000022279εY1/4

Y1/4^=b0+b1X1+b2X2.

Współczynniki regresji „Interpretowanie” zwykle oznaczają określenie, jaką zmianę w zmiennej zależnej sugeruje dana zmiana w każdej zmiennej niezależnej. Zmiany te są pochodnymi , które według reguły łańcuchowej są równe 4 β i Y 3 . Włączylibyśmy wtedy prognozy i powiedzieli coś w styludY/dXi4βiY3

Szacunki regresji zmiany jednostka będą związane ze zmianą Y z 4 b i Y 3 = 4 b I ( b 0 + b 1 X 1 + b 2 X 2 ) 3 .XiY4biY^34bi(b0+b1X1+b2X2)3

Zależność interpretacji na i X 2 jest po prostu nie wyrażone słowami,X1X2 w przeciwieństwie do sytuacji, bez przekształcania (jedna zmiana jednostka X i wiąże się ze zmianą b I w Y ) lub logarytmu (jeden zmiana procentowa z X i jest związany z b ı procent zmiany Y ). Zachowując jednak pierwszą formę interpretacji i obliczając 4 b 1 = 4 × 0,000075223 = 0,000301YXibiYXibiY4b14×0.0000752230.000301, moglibyśmy powiedzieć coś takiego

Zmiana jednostkowa opłat jest związana ze zmianą kolekcji o razy sześcian bieżących kolekcji; na przykład, jeśli bieżące kolekcje wynoszą 10 , to wzrost jednostkowy opłat jest związany ze wzrostem o 0,301 w kolekcjach, a jeśli obecne kolekcje są o 20 , to ten sam wzrost jednostkowy opłat jest związany ze wzrostem o 2,41 w kolekcjach.0.000301100.301202.41


Kiedy zapuszczasz korzenie inne niż czwarte - powiedzmy, gdy używasz jako odpowiedzi zamiast samego Y , z p niezerową - po prostu zamień wszystkie pojawienia się „ 4 ” w tej analizie na „ 1 / p ”. YpYp41/p

Whuber
źródło
12

Alternatywą dla transformacji jest tutaj uogólniony model liniowy z mocą funkcji łącza i mocą 1/4. Jaka rodzina błędów do użycia jest otwarta, co daje większą elastyczność niż w przypadku regresji liniowej i założenia normalności warunkowej. Jedną z głównych zalet tej procedury jest to, że prognozy są generowane automatycznie na oryginalnej skali pomiarowej, więc nie ma mowy o ponownej transformacji.

Nick Cox
źródło
4

Widziałem artykuły wykorzystujące kwartalne współczynniki regresji pierwiastkowej do myślenia o zmianach procentowych, unikając robienia dzienników (i pomijania obserwacji).

Jeśli jesteśmy zainteresowani wykorzystaniem pierwiastków kwartalnych do obliczenia zmian procentowych, wiemy, że:

Y^=(α+β^1X1+β^2X2)4dY^dX1=4β^1(α+β^1X1+β^2X2)3

YXX

dY^/dX1Y=4β^1α+β^1X1+β^2X2

For the equivalent of a log-log regression, in which we're interested in the percentage in Y resulting from a percentage change in X, we'd have:

dY^dX1X1Y^=4β^1X1α+β^1X1+β^2X2

It doesn't seem especially convenient (I prefer the log transformation), but it can be done, either evaluating the X values at the sample means or at hypothetical values.

I suppose, actually, you could replace the denominator with the sample average value of Y1/4, and that would be a bit more convenient.

user68005
źródło