Używam czwartej 1/4
transformacji mocy root ( ) na mojej zmiennej odpowiedzi, w wyniku heteroscedastyczności. Ale teraz nie jestem pewien, jak interpretować moje współczynniki regresji.
Zakładam, że musiałbym przestawić współczynniki na czwartą potęgę podczas transformacji wstecznej (patrz poniżej dane wyjściowe regresji). Wszystkie zmienne wyrażone są w jednostkach dolara w milionach, ale chciałbym poznać zmianę dolara w miliardach.
Utrzymując inną niezależną zmienną stałą, zmiana opłat wynosząca średnio miliard dolarów prowadzi do zmiany 32
kolekcji (lub 32 000 dolarów). Biorę 0.000075223 * 1000
(aby dostać się do miliardów) ^ 4 = 0.000032
. Czy teraz pomnożę tę liczbę przez 1 milion lub 1 miliard (pierwotna jednostka zmiennej zależnej jest w milionach)?
lm(formula = (Collections^(1/4)) ~ Fees + DIR)
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2.094573355 0.112292375 18.653 0.0000000000000151
Fees **0.000075223 **0.000008411 8.943 0.0000000131878713
DIR 0.000022279 0.000004107 5.425 0.0000221138881913
źródło
Odpowiedzi:
Najlepszym rozwiązaniem jest na początku wybranie wyrażenia zwrotnego, które ma znaczenie w dziedzinie studiów.
(Na przykład, gdy cofa się masy ciała na czynniki niezależne, to jest prawdopodobne, że albo korzenia kostki ( moc) lub pierwiastek kwadratowy ( 1 / 2 będą wskazane zasilania). Stwierdzając, że ciężar jest dobre przybliżenie do objętości sześcianu główny jest długość co stanowi charakterystyczną wielkość liniowy nadaje mu intuicyjnie potencjalnie interpretacji sposób Chociaż sama pierwiastek kwadratowy ma taką jasną interpretację, że znajduje się w pobliżu., 2 / 3, moc, która ma wymiary powierzchni : to może odpowiadać całkowitej powierzchni skóry).1/3 1/2 2/3
Czwarta moc jest wystarczająco bliska logarytmowi, że powinieneś rozważyć użycie logu , którego znaczenie jest dobrze zrozumiane. Ale czasami naprawdę okazuje się, że pierwiastek sześcienny lub pierwiastek kwadratowy lub jakaś taka ułamkowa moc wykonuje świetną robotę i nie ma oczywistej interpretacji. Następnie musimy wykonać trochę arytmetyki.
Przedstawiony w pytaniu model regresji obejmuje zmienną zależną („Kolekcje”) i dwie zmienne niezależne X 1 („Opłaty”) i X 2 („DIR”). To zakładaY X1 X2
Kod szacuje jako b 0 = 2,094573355 , β 1 jako b 1 = 0,000075223 , a β 2 jako b 2 = 0,000022279 . Zakłada również, że ε są normalne ze średnią zerową i szacuje ich wspólną wariancję (nie pokazano). Z tych szacunków, wyposażona wartość Y 1 / 4 jestβ0 b0=2.094573355 β1 b1=0.000075223 β2 b2=0.000022279 ε Y1/4
Współczynniki regresji „Interpretowanie” zwykle oznaczają określenie, jaką zmianę w zmiennej zależnej sugeruje dana zmiana w każdej zmiennej niezależnej. Zmiany te są pochodnymi , które według reguły łańcuchowej są równe 4 β i Y 3 . Włączylibyśmy wtedy prognozy i powiedzieli coś w styludY/dXi 4βiY3
Zależność interpretacji na i X 2 jest po prostu nie wyrażone słowami,X1 X2 w przeciwieństwie do sytuacji, bez przekształcania (jedna zmiana jednostka X i wiąże się ze zmianą b I w Y ) lub logarytmu (jeden zmiana procentowa z X i jest związany z b ı procent zmiany Y ). Zachowując jednak pierwszą formę interpretacji i obliczając 4 b 1 = 4 × 0,000075223 = 0,000301Y Xi bi Y Xi bi Y 4b1 4×0.000075223 0.000301 , moglibyśmy powiedzieć coś takiego
Kiedy zapuszczasz korzenie inne niż czwarte - powiedzmy, gdy używasz jako odpowiedzi zamiast samego Y , z p niezerową - po prostu zamień wszystkie pojawienia się „ 4 ” w tej analizie na „ 1 / p ”.Yp Y p 4 1/p
źródło
Alternatywą dla transformacji jest tutaj uogólniony model liniowy z mocą funkcji łącza i mocą 1/4. Jaka rodzina błędów do użycia jest otwarta, co daje większą elastyczność niż w przypadku regresji liniowej i założenia normalności warunkowej. Jedną z głównych zalet tej procedury jest to, że prognozy są generowane automatycznie na oryginalnej skali pomiarowej, więc nie ma mowy o ponownej transformacji.
źródło
Widziałem artykuły wykorzystujące kwartalne współczynniki regresji pierwiastkowej do myślenia o zmianach procentowych, unikając robienia dzienników (i pomijania obserwacji).
Jeśli jesteśmy zainteresowani wykorzystaniem pierwiastków kwartalnych do obliczenia zmian procentowych, wiemy, że:
For the equivalent of a log-log regression, in which we're interested in the percentage inY resulting from a percentage change in X , we'd have:
It doesn't seem especially convenient (I prefer the log transformation), but it can be done, either evaluating theX values at the sample means or at hypothetical values.
I suppose, actually, you could replace the denominator with the sample average value ofY1/4 , and that would be a bit more convenient.
źródło