Korelacja jest miarą liniowego powiązania między dwiema zmiennymi. Współczynnik determinacji, , jest miarą tego, jak dużą zmienność jednej zmiennej można „wyjaśnić” zmiennością drugiej.r 2
Na przykład, jeśli jest korelacją między dwiema zmiennymi, to . Stąd 64% zmienności w jednym z nich można wytłumaczyć różnicami w drugim. Dobrze?r 2 = 0,64
Moje pytanie brzmi, czy w podanym przykładzie jedno z poniższych stwierdzeń jest poprawne?
- 64% wartości spada wzdłuż linii regresji
- 80% wartości spada wzdłuż linii regresji
regression
correlation
r-squared
Bradex
źródło
źródło
Odpowiedzi:
Pierwsza część tego jest w zasadzie poprawna - ale model wyjaśnia 64% wariancji. W prostej regresji liniowej: Y ~ X, jeśli wynosi 0,64, oznacza to, że 64% zmiany Y zależy od liniowej zależności między Y i X. Możliwe jest silne powiązanie z bardzo niskim , jeśli związek jest silnie nieliniowy.R 2R2) R2)
Żadne z dwóch ponumerowanych pytań nie jest poprawne. Rzeczywiście, możliwe jest, że żaden punkt nie będzie leżał dokładnie na linii regresji. Nie mierzy się tego. Raczej chodzi o to, jak blisko jest średni punkt do linii. Jeśli wszystkie lub prawie wszystkie punkty są blisko (nawet jeśli żaden nie jest dokładnie na linii), wówczas będzie wysoki. Jeśli większość punktów znajduje się daleko od linii, będzie niski. Jeśli większość punktów jest blisko, ale kilka jest daleko, regresja jest niepoprawna (problem wartości odstających). Inne rzeczy też mogą pójść nie tak.R 2R2) R2
Ponadto pozostawiłem pojęcie „daleko” raczej niejasne. Będzie to zależeć od rozłożenia X-ów. Sprecyzowanie tych pojęć jest częścią tego, czego uczysz się na kursie regresji; Nie wchodzę tutaj.
źródło
Masz rację z pierwszą częścią swojego oświadczenia. Zwykłym sposobem interpretacji współczynnika determinacji jest odsetek zmian zmiennej zależnej ( ), który jesteśmy w stanie wyjaśnić zmiennymi objaśniającymi. Dokładną interpretację i wyprowadzenie współczynnika determinacji można znaleźć tutaj y V a r ( y ) R 2R2 y Var(y) R2
http://economictheoryblog.com/2014/11/05/the-coefficient-of-determination-latex-r2/
Jednak o wiele mniej znaną interpretacją współczynnika determinacji jest interpretacja go jako współczynnika korelacji Squared Pearsona między obserwowanymi wartościami a dopasowanymi wartościami . Dowód, że współczynnik determinacji jest równoważny kwadratowemu współczynnikowi korelacji Pearsona między obserwowanymi wartościami a dopasowanymi wartościami można znaleźć tutaj R i r i r i r iR2 yi y^i yi y^i
http://economictheoryblog.com/2014/11/05/proof/
Moim zdaniem są to jedyne znaczące sposoby interpretacji współczynnika determinacji . Wynika z tego, że dwa stwierdzenia, które podałeś, nie mogą pochodzić z .R 2R2 R2
źródło
Niether 1 ani 2 są poprawne.
Następnie
źródło