Oto mój kontekst dla tego pytania: Z tego co mogę powiedzieć, nie możemy uruchomić zwykłej regresji metodą najmniejszych kwadratów w R, gdy używamy danych ważonych i survey
pakietu. Tutaj musimy użyć svyglm()
, który zamiast tego uruchamia uogólniony model liniowy (który może być tym samym? Jestem tutaj rozmyty pod względem tego, co jest inne).
W OLS i przez lm()
funkcję oblicza wartość R-kwadrat, której interpretację rozumiem. Jednak svyglm()
nie wydaje się to obliczać i zamiast tego daje mi dewiację, co według mojej krótkiej podróży po Internecie jest miarą dopasowania, interpretowaną inaczej niż R-kwadrat.
Sądzę więc, że zasadniczo mam dwa pytania, na które liczyłem:
- Dlaczego nie możemy uruchomić OLS w
survey
pakiecie, podczas gdy wydaje się, że jest to możliwe w przypadku ważonych danych w Stata? - Jaka jest różnica w interpretacji między odchyleniem uogólnionego modelu liniowego a wartością kwadratową?
Odpowiedzi:
svyglm
da ci model liniowy, jeśli go użyjesz,family = gaussian()
który wydaje się być domyślny z winiety ankiety (w wersji 3.32-1). Zobacz przykład, w którym znajdująregmodel
.Wygląda na to, że pakiet po prostu upewnia się, że używasz prawidłowych wag podczas wywoływania
glm
. Tak więc, jeśli twój wynik jest ciągły i zakładasz, że jest normalnie dystrybuowany, powinieneś użyćfamily = gaussian()
. Wynikiem jest ważony model liniowy. Ta odpowiedźstwierdzając, że rzeczywiście można to zrobić z
survey
pakietem. Co do następującego pytaniaJest to prosta formuła, aby uzyskać z jak niektórzy ludzie wspomniano w komentarzach. Dodanie ciężarów również niczego nie zmienia, jak pokazano poniżejR2)
family = gaussian()
Odchylenie jest tylko sumą błędów kwadratowych podczas używania
family = gaussian()
.Ostrzeżenia
Zakładam, że chcesz model liniowy z twojego pytania. Ponadto nigdy nie korzystałem z
survey
pakietu, ale szybko go przejrzałem i poczyniłem założenia dotyczące tego, co robi, co stwierdzam w mojej odpowiedzi.źródło