Ponieważ modelowanie regresji jest często bardziej „sztuką” niż nauką, często testuję wiele iteracji struktury regresji. Jakie są skuteczne sposoby podsumowania informacji z tych wielu uruchomień modelu, próbując znaleźć „najlepszy” model? Jednym z zastosowanych przeze mnie sposobów jest umieszczenie wszystkich modeli na liście i przeglądanie summary()
tej listy, ale wyobrażam sobie, że istnieją bardziej wydajne sposoby porównywania?
Przykładowy kod i modele:
ctl <- c(4.17,5.58,5.18,6.11,4.50,4.61,5.17,4.53,5.33,5.14)
trt <- c(4.81,4.17,4.41,3.59,5.87,3.83,6.03,4.89,4.32,4.69)
group <- gl(2,10,20, labels=c("Ctl","Trt"))
weight <- c(ctl, trt)
lm1 <- lm(weight ~ group)
lm2 <- lm(weight ~ group - 1)
lm3 <- lm(log(weight) ~ group - 1)
#Draw comparisions between models 1 - 3?
models <- list(lm1, lm2, lm3)
lapply(models, summary)
r
regression
Gonić
źródło
źródło
Odpowiedzi:
Wykreśl je!
http://svn.cluelessresearch.com/tables2graphs/longley.png
Lub, jeśli musisz, użyj tabel: Pakiet apsrtable lub
mtable
funkcja w pakiecie memisc .Za pomocą
mtable
źródło
grid
nie jestlattice
:)memisc
wcześniej nie zdawałem sobie sprawy , wygląda na bardzo poręczny pakiet, który można mieć w kołczanie!Poniższe nie odpowiada dokładnie na pytanie. Może jednak dać ci kilka pomysłów. Jest to coś, co ostatnio zrobiłem, aby ocenić dopasowanie kilku modeli regresji przy użyciu od jednej do czterech zmiennych niezależnych (zmienna zależna była w pierwszej kolumnie ramki danych df1).
Zawartość as.character (formlist) to
Potem zebrałem kilka przydatnych wskaźników
Ostateczna ramka danych to
Na koniec wykres Cp (przy użyciu biblioteki wle)
źródło