Dlaczego podniesienie kwadratu

13

To może być podstawowe pytanie, ale zastanawiałem się, dlaczego wartość w modelu regresji może być po prostu podniesiona do kwadratu, aby uzyskać wartość wyjaśnionej wariancji?R

Rozumiem, że współczynnik może dać siłę związku, ale nie rozumiem, jak proste podniesienie tej wartości do kwadratu daje miarę wyjaśnionej wariancji.R

Jakieś proste wytłumaczenie tego?

Bardzo dziękuję za pomoc w tym!

David
źródło
Szukasz czegoś intuicyjnego lub bardziej matematycznego? Czy przejrzałeś już niektóre inne pytania na temat i współczynników korelacji na tej stronie? R2
kardynał
1
Dwie pokrewne pytania są tutaj i tutaj , na przykład. Jeśli bawisz się tam równaniami, będziesz w stanie uzyskać matematyczną równoważność. Jednak żadne z nich nie będzie szczególnie pomocne z intuicji.
kardynał
Widzę to odwrotnie. Jest to kwadrat R, który jest zdefiniowany jako 1-wariancja resztkowa / wariancja całkowita, a następnie R jest dodatnim pierwiastkiem kwadratowym z tego. Po prostu zdarza się, że gdy mamy prostą regresję liniową, kwadrat R zmniejsza się do kwadratu współczynnika korelacji.
Michael R. Chernick
@Michael, niewątpliwie zamierzałeś powiedzieć odpowiednio oznaczony pierwiastek kwadratowy, a nie dodatni .
kardynał
1
Rr

Odpowiedzi:

16

RYXθRcos(θ)YX||Y||cos(θ)XYX||Y||sin(θ)X

σY2=σY2cos2(θ)+σY2sin2(θ)
R2R
Dilip Sarwate
źródło
2
(+1) Naprawdę nie dzieje się tu zbyt dużo ręcznego machania ręką. Moim zdaniem geometryczny punkt widzenia jest najbardziej intuicyjny. Prawdopodobnie pojawi się wysokiej jakości postać open-source, która dokładnie to przedstawia.
kardynał
cor(y,y^)2R2
1
To nie odpowiada na pytanie, ale pokazuje, w jaki sposób kwadrat R jest wymieniany jako kwadrat współczynnika korelacji bez odniesienia do R. Tak więc źródła potwierdzające lub odrzucające moje twierdzenie mogą być trudne do znalezienia. Pochodzi z artykułu na temat współczynnika determinacji w Wikipedii:
Michael R. Chernick
Jako kwadratowy współczynnik korelacji Podobnie, po regresji co najmniej kwadratów za pomocą modelu stały + liniowy (tj. Prosta regresja liniowa), R2 równa się kwadratowi współczynnika korelacji między obserwowanymi a modelowanymi (przewidywanymi) wartościami danych.
Michael R. Chernick
W warunkach ogólnych wartość R2 jest czasem obliczana jako kwadrat współczynnika korelacji między wartościami pierwotnymi i modelowanymi. W tym przypadku wartość nie jest bezpośrednią miarą tego, jak dobre są modelowane wartości, ale raczej miarą tego, jak dobry predyktor może być skonstruowany na podstawie modelowanych wartości (poprzez utworzenie zmienionego predyktora w postaci α + βƒi). Według Everitt (2002, s. 78) to użycie jest w szczególności definicją terminu „współczynnik determinacji”: kwadrat korelacji między dwiema (ogólnymi) zmiennymi.
Michael R. Chernick