Kiedy R jest kwadratem ujemne?

77

Mi się, że nie mogą być ujemne, jak to jest kwadratem R. Jednakże uruchomiony prostą regresję liniową w SPSS z jedną zmienną niezależną i zmienną zależną. Moje wyjście SPSS dają mi ujemną wartość R 2 . Jeśli nie było obliczyć tego ręką z R wówczas R 2 to pozytywny. Co zrobił SPSS, aby obliczyć to jako negatywne?R2R2R2

R=-.395
R squared =-.156
B (un-standardized)=-1261.611

Kod, którego użyłem:

DATASET ACTIVATE DataSet1. 
REGRESSION /MISSING LISTWISE /STATISTICS COEFF OUTS R ANOVA 
           /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN 
           /DEPENDENT valueP /METHOD=ENTER ageP

Dostaję wartość ujemną. Czy ktoś może wyjaśnić, co to oznacza?

Negatywne RSquared

wprowadź opis zdjęcia tutaj

Anne
źródło
3
Czy to odpowiada na twoje pytanie? stats.stackexchange.com/questions/6181/… Jeśli nie, to proszę podać więcej informacji: to jest „wyjście SPSS” jakiej procedury?
whuber
2
Czy twój model regresji liniowej ma przechwytywanie?
NPE,
2
@ Anne Znowu, jakiej procedury SPSS używasz?
whuber
1
(0.395)2=0.156
1
Zmienna zależna to cena domów, więc możliwe jest, że 95% CI może wynosić 120 000. Niestety nie mogę opublikować tutaj danych, ponieważ byłoby to sprzeczne z warunkami korzystania z danych.
Anne,

Odpowiedzi:

105

R2R2R2R2

Y1500

wprowadź opis zdjęcia tutaj

Biorąc pod uwagę te dane, model nie ma żadnego sensu. Jest to oczywiście zły model, być może wybrany przypadkowo.

(SSreg)(SStot)R21SSregSStotSSregSStotR2

R2rR2R2

R2

Harvey Motulsky
źródło
3
@ JMS To jest przeciwieństwo tego, co wskazuje mój Google: „/ ORIGIN” naprawia punkt przecięcia na 0; „/ NOORIGIN” „mówi SPSS, aby nie tłumił stałej” ( Przewodnik wprowadzający do SPSS dla Windows )
whuber
10
@whuber Prawidłowo. @ harvey-motulsky Ujemna wartość R ^ 2 jest matematyczną niemożliwością (i sugeruje błąd komputera) dla regularnej regresji OLS (z przechwyceniem). To właśnie robi polecenie „REGRESJA” i o co pyta oryginalny plakat. Ponadto w przypadku regresji OLS R ^ 2 jest kwadratową korelacją między wartościami przewidywanymi i obserwowanymi. Dlatego musi być nieujemny. W przypadku prostej regresji OLS z jednym predyktorem jest to równoważnik kwadratowej korelacji między predyktorem a zmienną zależną - znowu musi to być nieujemna.
Wolfgang
1
@whuber Rzeczywiście. Mój błąd; oczywiście nie używam SPSS - ani nie czytam, najwyraźniej :)
JMS
1
@whuber. Dodałem akapit wskazujący, że przy regresji liniowej R2 może być ujemny tylko wtedy, gdy przecięcie (lub może nachylenie) jest ograniczone. Bez ograniczeń R2 musi być dodatnie i równe kwadratowi r, współczynnikowi korelacji.
Harvey Motulsky
1
@HarveyMotulsky, w tym przypadku punkt przecięcia lub nachylenie nie były ograniczone. Wygląda na to, że mówisz, że Rsquared może być ujemny tylko wtedy, gdy są one ograniczone. Czy możesz wyjaśnić, co mogło się wydarzyć w tym konkretnym przypadku?
Anne,
18

Czy zapomniałeś włączyć przechwytywanie do regresji? Nie znam kodu SPSS, ale na stronie 21 Ekonometrii Hayashi:

R2

R2=1i=1nei2i=1n(yiy¯)2

R2

Sprawdzę i upewnię się, że SPSS zawiera przechwytywanie w twojej regresji.

jefflovejapan
źródło
4
NOORIGIN komenda w jej kodzie opowiada które przechwytują został uwzględniony w modelu
ttnphns
2
to jest dziwne. Domyślam się, że NOORIGINoznaczałoby to, że przechwytywanie nie było uwzględnione w modelu, po prostu od nazwy.
Matt O'Brien
6

Może się to zdarzyć, jeśli masz szereg czasowy, który jest Niid i skonstruujesz nieodpowiedni model ARIMA formy (0,1,0), który jest pierwszą różnicą modelu chodzenia losowego bez dryfu, a następnie wariancji (suma kwadratów - SSE) reszty będą większe niż wariancja (suma kwadratów SSO) oryginalnej serii. Zatem równanie 1-SSE / SSO da liczbę ujemną, gdy SSE wykonuje SSO. Widzieliśmy to, gdy użytkownicy po prostu pasowali do założonego modelu lub stosowali nieodpowiednie procedury w celu zidentyfikowania / utworzenia odpowiedniej struktury ARIMA. Większy komunikat JEST, że model może zniekształcić (podobnie jak parę złych okularów) widzenie. Bez dostępu do twoich danych w innym przypadku miałbym problem z wyjaśnieniem twoich błędnych wyników. Czy zwróciłeś na to uwagę IBM?

Pomysł zakładania, że ​​przyjęty model przyniesie efekt przeciwny do zamierzonego, został powtórzony przez Harveya Motulsky'ego. Świetny post Harvey!

IrishStat
źródło
1
stat. Dzięki. Nie, nie rozmawiałem z IBM. Dane nie są szeregami czasowymi. Dane pochodzą z określonego momentu.
Anne,
5
@Anne i inni: Ponieważ twoje dane nie są szeregami czasowymi i nie korzystasz z procedury szeregów czasowych, zignoruj ​​moją odpowiedź. Inni, którzy zaobserwowali ujemne kwadraty R, gdy są zaangażowani w szeregi czasowe, mogą uznać mój post za interesujący i stycznie informacyjny. Inni niestety mogą nie.
IrishStat,
@IrishStat: Czy możesz dodać link do postu Harveya Motulsky'ego?
kjetil b halvorsen
Harvey odpowiedział na pytanie tutaj.
IrishStat