Jak wybrać pomiędzy różnymi Skorygowane

15

Mam na myśli skorygowane wzory R-kwadrat zaproponowane przez:

  • Ezekiel (1930), który moim zdaniem jest obecnie używany w SPSS.

    Radjusted2=1(N1)(Np1)(1R2)
  • Olkin and Pratt (1958)

    Runbiased2=1(N3)(1R2)(Np1)2(N3)(1R2)2(Np1)(Np+1)

W jakich okolicznościach (jeśli w ogóle) powinienem preferować „dostosowane” do „obiektywnych” ?R2

Bibliografia

  1. Ezekiel, M. (1930). Metody analizy korelacji . John Wiley and Sons, Nowy Jork.
  2. Olkin I., Pratt JW (1958). Bezstronne oszacowanie niektórych współczynników korelacji. Annals of Mathematical Statistics , 29 (1), 201-211.
user1205901 - Przywróć Monikę
źródło

Odpowiedzi:

5

Nie chcąc doceniać odpowiedzi @ttnphns, chciałem usunąć odpowiedź z komentarzy (szczególnie biorąc pod uwagę, że link do artykułu wygasł). Odpowiedź Matt Krause zapewnia użyteczną dyskusję na temat różnicy między i R 2 d j ale nie omawiać decyzji, o której R 2 d j wzór do wykorzystania w danym przypadku.R2Radj2Radj2

Jak dyskutować w tej odpowiedzi , Yin i Fan (2001) zapewnić przegląd dobre z wielu różnych wzorów do oszacowania wariancji populacji wyjaśnił , z których wszystkie mogą potencjalnie być oznaczony typ skorygowanej R 2 .ρ2R2

Przeprowadzają symulację, aby ocenić, który z szerokiego zakresu skorygowanych wzorów r-kwadrat zapewnia najlepsze bezstronne oszacowanie dla różnych wielkości próby, i wzajemnych korelacji predyktorów. Sugerują, że formuła Pratta może być dobrą opcją, ale nie sądzę, aby badanie było ostateczne w tej sprawie.ρ2

Aktualizacja: Raju i inni (1997) Należy zauważyć, że skorygowane wzory różnią się w zależności od tego, czy są one przeznaczone do oszacowania dostosowane R 2 przy założeniu stałej X lub losową X. predcitors. W szczególności formuła Ezekiala jest zaprojektowana do oszacowania ρ 2 w kontekście ustalonego x, a formuły Olkin-Pratt i Pratt są zaprojektowane do oszacowania ρ 2 w kontekście losowym x. Nie ma dużej różnicy między formułami Olkina-Pratta i Pratta. Założenia o stałej x dopasowują się do planowanych eksperymentów, a losowe x są zgodne z założeniem, że wartości zmiennych predykcyjnych są próbką możliwych wartości, jak to zwykle ma miejsce w badaniach obserwacyjnych. WidziećR2R2ρ2ρ2ta odpowiedź do dalszej dyskusji . Nie ma również dużej różnicy między tymi dwoma typami formuł, ponieważ rozmiary próbek stają się umiarkowanie duże (patrz tutaj, aby omówić wielkość różnicy ).

Podsumowanie praktycznych zasad

  • Jeśli przyjmiesz, że twoje obserwacje zmiennych predykcyjnych są losową próbką z populacji i chcesz oszacować dla pełnej populacji zarówno predyktorów, jak i kryterium (tj. Założenie losowe-x), użyj wzoru Olkina-Pratta (lub formuła Pratta).ρ2
  • Jeśli przyjmiesz, że twoje obserwacje są ustalone lub nie chcesz generalizować poza obserwowane poziomy predyktora, oszacuj za pomocą wzoru Ezechiela.ρ2
  • Jeśli chcesz dowiedzieć się o prognozowaniu poza próbą za pomocą równania regresji próbki, warto przyjrzeć się pewnej formie procedury walidacji krzyżowej.

Bibliografia

  • Raju, NS, Bilgic, R., Edwards, JE, i Fleer, PF (1997). Przegląd metodologii: Szacowanie ważności populacji i walidacji krzyżowej oraz zastosowanie równych wag w prognozowaniu. Applied Psychological Measurement, 21 (4), 291–305.
  • R2
Jeromy Anglim
źródło
13

R2R2R2R2R2

R2r2r2R2R2

Matt Krause
źródło
2
Dzięki, stwierdziłem, że jest to bardzo jasne wytłumaczenie różnicy między R-kwadratem a skorygowanym R-kwadratem. Twoim zdaniem, jak bezstronny R-kwadrat pasuje do tego obrazu?
user1205901 - Przywróć Monikę
5
Rzeczywiście istnieją różne formuły do ​​oszacowania populacji R ^ 2. Zobacz na przykład studyforquals.pbworks.com/f/yin.pdf . Mówi się, że „Skorygowane R ^ 2” Fishera (= Wherry'ego) jest nieco negatywnie tendencyjne (wciąż zależy od wielkości próbki, ale nie zależy od liczby predyktorów), więc wersja Olkina-Pratta jest prawdopodobnie nieco lepsza.
ttnphns
1
@ttnphns, może powinna to być odpowiedź zamiast komentarza. Wydaje mi się, że bardziej niż ta odpowiedź odnosi się do pierwotnego pytania.
Gung - Przywróć Monikę
1
R2)R2)
1
@ttnphns, zgadzam się z Gung! Powinieneś napisać odpowiedź i podziękować. Czy możesz również potwierdzić to, co napisałem? JStor zachowuje się dzisiaj dziwnie i nie pozwala mi przeczytać oryginalnej pracy Olkina i Pratta.
Matt Krause,