Populacja r-kwadrat można zdefiniować przy założeniu wyników stałych lub wyników losowych:
Naprawiono wyniki: Wielkość próby i poszczególne wartości predyktorów są utrzymywane na stałym poziomie. A zatem, jest proporcją wariancji wyjaśnioną w wyniku równaniem regresji populacji, gdy wartości predyktora są utrzymywane na stałym poziomie.
Losowe wyniki: Konkretne wartości predyktorów pochodzą z rozkładu. A zatem, odnosi się do odsetka wariancji wyjaśnionego w wyniku w populacji, w której wartości predyktorów odpowiadają rozkładowi populacji predyktorów.
Wcześniej pytałem o to, czy to rozróżnienie robi dużą różnicę w szacunkach. Zapytałem też ogólnie o sposób obliczenia obiektywnej oceny .
Widzę, że wraz ze wzrostem wielkości próby rozróżnienie między wynikiem stałym a wynikiem losowym staje się coraz mniej ważne. Próbuję jednak potwierdzić, czy skorygowane jest przeznaczony do oszacowania wyniku stałego lub wyniku losowego .
pytania
- Jest dostosowany zaprojektowany do oszacowania wyniku stałego lub wyniku losowego ?
- Czy istnieje zasadnicze wyjaśnienie, w jaki sposób wzór skorygowanego r-kwadratu odnosi się do jednej lub drugiej formy ?
Tło mojego zamieszania
Kiedy czytam Yin and Fan (2001, s. 206), piszą:
Jednym z podstawowych założeń modelu regresji wielokrotnej jest to, że wartości zmiennych niezależnych są znanymi stałymi i są ustalane przez badacza przed eksperymentem. Tylko zmienna zależna może się zmieniać w zależności od próbki. Ten model regresji nazywany jest stałym modelem regresji liniowej .
Jednak w naukach społecznych i behawioralnych wartości zmiennych niezależnych są rzadko ustalane przez badaczy, a także podlegają przypadkowym błędom. Dlatego zasugerowano drugi model regresji dla aplikacji, w którym zarówno zmienne zależne, jak i niezależne mogą się zmieniać (Binder, 1959; Park i Dudycha, 1974). Ten model nazywa się modelem losowym (lub modelem korekcji). Chociaż szacunki maksymalnego prawdopodobieństwa współczynników regresji uzyskane z modeli losowych i stałych są takie same przy założeniach normalności, ich rozkłady są bardzo różne. Model losowy jest tak złożony, że potrzeba więcej badań, zanim będzie można go zaakceptować zamiast powszechnie stosowanego stałego modelu regresji liniowej. Dlatego zwykle stosowany jest model stały, nawet gdy założenia nie są całkowicie spełnione (Claudy, 1978). Takie zastosowania modelu regresji stałej z naruszonymi założeniami spowodowałyby „przeszacowanie”, ponieważ błąd losowy wprowadzony z mniej niż idealnych danych przykładowych jest zwykle wykorzystywany w procesie. W rezultacie uzyskany w ten sposób współczynnik wielokrotnej korelacji próbki ma tendencję do przeceniania prawdziwej wielokrotnej korelacji populacyjnej (Claudy, 1978; Cohen i Cohen, 1983; Cummings, 1982).
Nie byłem więc pewien, czy powyższe stwierdzenie mówi o dostosowaniu kompensuje błąd wprowadzony przez model losowy lub to, czy było to tylko zastrzeżenie w papierze oznaczające istnienie modelu losowego, ale to, że papier miał skupić się na modelu ustalonym.
Bibliografia
- Yin, P. i Fan, X. (2001). Doceniającyskurcz w regresji wielorakiej: porównanie różnych metod analitycznych. The Journal of Experimental Education, 69 (2), 203-224. PDF
źródło