Jak przekonwertować znormalizowane współczynniki na niestandardowe współczynniki?

11

Moim celem jest wykorzystanie współczynników uzyskanych w poprzednich badaniach na ten temat, aby przewidzieć rzeczywiste wyniki na podstawie zestawu niezależnych zmiennych. Jednak w pracy naukowej wymieniono tylko współczynniki Beta i wartość t. Chciałbym wiedzieć, czy można przekonwertować znormalizowane współczynniki na niestandardowe.

Czy użyteczne byłoby przekonwertowanie moich niestandardowych zmiennych niezależnych na zmienne standardowe w celu obliczenia przewidywanej wartości? Jak powróciłbym do niestandardowej przewidywanej wartości (jeśli to w ogóle możliwe ...)

Dodano przykładowy wiersz z papieru:

Liczba linii autobusowych (linie autobusowe) | 0,275 (Beta) | 5,70 *** (wartość t)

Dostaję to również w odniesieniu do zmiennych niezależnych:

Liczba linii autobusowych (linie autobusowe) | 12,56 (średnio) | 9,02 (Std) | 1 (min) | 53 (maks.)


źródło
Jak ustandaryzowano współczynniki? Ogólnie rzecz biorąc, mają jednostkę, która jest jednostką podzieloną przez jednostkę , jaka jest ich jednostka w papierze? YβYX
gui11aume
1
Nie jestem pewien, czy rozumiem twoje pytanie. Oto przykładowy wiersz niezależnej zmiennej po analizie regresji z artykułu. Charakterystyka dostawy tranzytu: liczba linii autobusowych (linie autobusowe) | 0,275 (Beta) | 5,70 *** (wartość t)
Sam współczynnik nie jest znormalizowany, jak wspomniano w gui11aume. Ale statystyka t to szacowany współczynnik podzielony przez szacowane odchylenie standardowe. Biorąc pod uwagę t i stopnie swobody, można obliczyć wartość p i szacowane odchylenie standardowe, ponieważ Beta = wartość t x szacowane odchylenie standardowe. Ale nie jestem pewien, czy tego właśnie szukasz. Ocena beta nie jest ustandaryzowana. Statystyka t jest znormalizowaną formą oceny rytmu. Masz już znormalizowany współczynnik.
Michael R. Chernick

Odpowiedzi:

14

Wygląda na to, że papier używa w formularzu modelu regresji wielokrotnej

Y=β0+jaβjaξja+ε

gdzie są znormalizowanymi wersjami zmiennych niezależnych; mianowicie. ,ξja

ξja=xja-mjasja

z średnią (taką jak 12.56 w przykładzie) i odchyleniem standardowym (takim jak 9.02 w przykładzie) wartości zmiennej (w tym przypadku „szynami”). jest przechwytywaniem (jeśli występuje). Podłączenie tego wyrażenia do dopasowanego modelu, z jego „betami” zapisanymi jako (0,275 w przykładzie) i wykonanie algebry daje oszacowanias i i th x i β 0 ^ β imjasjajathxjaβ0βja^

Y^=β0^+jaβja^xja-mjasja=(β0^-(jaβjamja^sja))+ja(βja^sja)xja.

To pokazuje, że współczynniki w modelu (oprócz stałego składnika) są uzyskiwane przez podzielenie beta przez standardowe odchylenia zmiennych niezależnych i że punkt przecięcia jest korygowany przez odjęcie odpowiedniej liniowej kombinacji beta.xja

Daje to dwa sposoby przewidywania nowej wartości z wektora niezależnych wartości:(x1,,xp)

  1. Korzystając ze średnich i odchyleń standardowych podanych w artykule (nie przeliczonych z żadnych nowych danych!), Oblicz i podłącz je do wzoru regresji podanego przez beta lub równoważnies i ( ξ 1 , , ξ p ) = ( ( x 1 - m 1 ) / s 1 , , ( x p - m p ) / s p )mjasja (ξ1,,ξp)=((x1-m1)/s1,,(xp-mp)/sp)

  2. Podłącz do algebraicznie równoważnej formuły wyprowadzonej powyżej.(x1,,xp)

Jeśli w artykule użyto Uogólnionego Modelu Liniowego , może być konieczne wykonanie tego obliczenia poprzez zastosowanie odwrotnej funkcji „link” do . Na przykład w przypadku regresji logistycznej konieczne byłoby zastosowanie funkcji logistycznej celu uzyskania przewidywanego prawdopodobieństwa ( jest przewidywanym prawdopodobieństwem logarytmicznym). 1/(1+exp( - T )) YY^1/(1+exp(-Y^))Y^

Whuber
źródło
Perfekcyjnie, dziękuję! Otrzymałem pomoc od kolegi. Jeszcze jedno pytanie: moja nowa wartość (Y-hat) jest bardzo niska. W regresji autor wykorzystuje zmienną zależną przekształconą logarytmicznie. Czy to oznacza, że ​​powinienem exp (Y-hat) rozwinąć się z powrotem do nietransformowanej jednostki miary.
Ponadto w artykule nie zawarto przechwytywania Y, a testowanie metody exp (kapelusz Y) wydaje się wskazywać, że powinna istnieć wartość przechwytywania Y reprezentująca niektóre wariancje nie wyjaśnione przez model, w celu podnieść przewidywany wynik do rozsądnego poziomu.
Zatem to nie współczynniki są normalizowane. To są zmienne.
Michael R. Chernick
1
Michael M, tak, jest prawdopodobnie tym, czego chcesz i tak, musisz dowiedzieć się, co to jest przechwycenie. Być może będziesz musiał sfałszować go, zgadując punkt przecięcia i zmieniając go, dopóki model nie wyświetli wystarczająco grafik i tabel w papierze. exp(y^)
whuber
Jeśli chcesz zrobić to, o co prosi tytuł, spójrz tutaj: www3.nd.edu/~rwilliam/stats1/x92.pdf, jeśli y jest również znormalizowane. Zobacz także stats.stackexchange.com/questions/235057/…
Chris
1

b=p×sysx
  • x jest zmienną niezależną
  • y jest zmienną zależną
  • s jest odchyleniem standardowym
  • p jest współczynnikiem ścieżki
  • b jest współczynnikiem regresji.
Lanca
źródło
2
Nie jestem pewien, co to jest współczynnik ścieżki. Wygląda na to, że B jest współczynnikiem regresji, który nie byłby bezwymiarowy. Będzie to y jednostek na 1 x jednostkę. Jednak p = B sx / sy, gdzie sx jest szacunkowym odchyleniem standardowym x podzielonym przez oszacowane odchylenie standardowe w yip jest bezwymiarowe. Reprezentuje szacunkową korelację między xiy. Lance, jeśli tego właśnie chciałeś, wprowadź zmiany, edytując swój post.
Michael R. Chernick