Powiedzmy, że mam dwie tablice 1-wymiarowe, i . Każdy zawiera 100 punktów danych. 1 jest rzeczywiste dane i 2 jest przewidywania modelu. W tym przypadku, R 2 wartość będzie: R 2 = 1 - S S r e s
W międzyczasie byłoby to równe wartości kwadratowej współczynnika korelacji,
Teraz, jeśli mogę zamienić dwa: 2 jest rzeczywiste dane, a 1 jest przewidywania modelu. Z równania ( 2 ) , ponieważ współczynnik korelacji nie zależy, który pochodzi pierwsze, R 2 wartość będzie taka sama. Jednak z równania ( 1 ) , S S t o t = ∑ i ( y i - ˉ y ) 2 , wartość R 2 ulegnie zmianie, ponieważ S S zmieniła się, jeżeli przełącznikz 1 do 2 ; w międzyczasieS S r e s = ∑ i ( f i - ˉ y ) 2 nie zmienia się.
Moje pytanie brzmi: w jaki sposób mogą się one ze sobą sprzeczne?
Edytuj :
Zastanawiałem się, czy będzie relacja w równaniu. (2) nadal stoją, jeśli nie jest to prosta regresja liniowa, tj. Związek między IV i DV nie jest liniowy (może być wykładniczy / log)?
Czy ta relacja nadal będzie obowiązywać, jeśli suma błędów prognozowania nie będzie równa zero?
correlation
r-squared
Shawn Wang
źródło
źródło
Odpowiedzi:
To prawda, że zmieni się ... ale zapomniałeś, że zmieni się również regresja sumy kwadratów. Rozważmy więc prosty model regresji i oznaczmy współczynnik korelacji jako r 2 x y = S 2 x ySStot , gdzie użyłem subindeksuxy,aby podkreślić fakt, żexjest zmienną niezależną, ayjest zmienną zależną. Oczywiście,r2 x y pozostaje niezmienione, jeśli zamieniszx zapomocąy. Możemy łatwo pokazać, żeSSRxy=Syy(R2 x y ), gdzieSSRxyjest sumą regresji kwadratów i r2xy=S2xySxxSyy xy x y r2xy x y SSRxy=Syy(R2xy) SSRxy jest całkowitą sumą kwadratów, gdzie x jest niezależny, a y jest zmienną zależną. Dlatego: R 2 x y = S S R x ySyy x y gdzieSSExyjest odpowiednią resztkową sumą kwadratów, gdziexjest niezależny, ayjest zmienną zależną. Zauważ, że w tym przypadku mamySSExy=b2 x y Sxxzb=Sxy
źródło
Pełny dowód na to, jak uzyskać współczynnik determinacji R2 z kwadratowego współczynnika korelacji Pearsona między wartościami obserwowanymi yi a wartościami dopasowanymi y ^ i można znaleźć pod następującym linkiem:
http://economictheoryblog.wordpress.com/2014/11/05/proof/
Moim zdaniem powinno to być dość łatwe do zrozumienia, wystarczy wykonać pojedyncze kroki. Wydaje mi się, że patrząc na to, konieczne jest zrozumienie, w jaki sposób naprawdę działa relacja między dwiema kluczowymi postaciami.
źródło
Kwadrat korelacji między odpowiedzią a dopasowanym modelem liniowym.
źródło
źródło
źródło