Chciałbym przetestować różnicę w odpowiedzi dwóch zmiennych na jeden predyktor. Oto minimalny odtwarzalny przykład.
library(nlme)
## gls is used in the application; lm would suffice for this example
m.set <- gls(Sepal.Length ~ Petal.Width, data = iris,
subset = Species == "setosa")
m.vir <- gls(Sepal.Length ~ Petal.Width, data = iris,
subset = Species == "virginica")
m.ver <- gls(Sepal.Length ~ Petal.Width, data = iris,
subset = Species == "versicolor")
Widzę, że współczynniki nachylenia są różne:
m.set$coefficients
(Intercept) Petal.Width
4.7771775 0.9301727
m.vir$coefficients
(Intercept) Petal.Width
5.2694172 0.6508306
m.ver$coefficients
(Intercept) Petal.Width
4.044640 1.426365
Mam trzy pytania:
- Jak mogę sprawdzić różnicę między stokami?
- Jak mogę sprawdzić różnicę między różnicami rezydualnymi?
- Jaki jest prosty, skuteczny sposób przedstawienia tych porównań?
Powiązane pytanie, Metoda porównywania współczynnika zmiennej w dwóch modelach regresji , sugeruje ponowne uruchomienie modelu ze zmienną fikcyjną w celu zróżnicowania nachyleń, czy istnieją opcje, które pozwoliłyby na użycie niezależnych zestawów danych?
Odpowiedzi:
Jak mogę sprawdzić różnicę między stokami?
Dołącz manekina do gatunku, pozwól mu wchodzić w interakcje z i sprawdź, czy ten manekin jest znaczący. Niech mieć długość sepal i mieć szerokość pedał i być zmienne obojętne dla trzech gatunków. Porównaj modelL i P i S 1 , S 2 , S 3P.ja L.ja P.ja S.1, S2), S3)
z modelem, który pozwala na wpływ dla każdego gatunku:P.ja
Estymatorami GLS są MLE, a pierwszy model jest podmodelem na drugim, więc możesz tutaj użyć testu współczynnika wiarygodności. Prawdopodobieństwa można wyodrębnić za pomocą4 4
logLik
funkcji, a stopnie swobody dla testu wynoszą ponieważ usunięto parametry, aby dotrzeć do podmodelu.4Jaki jest prosty, skuteczny sposób przedstawienia porównania?
Myślę, że najbardziej atrakcyjnym sposobem byłoby wykreślenie linii regresji dla każdego gatunku na tych samych osiach, być może z paskami błędów opartymi na standardowych błędach. To sprawiłoby, że różnica (lub brak różnicy) między gatunkiem a ich związkiem z bardzo widoczna.P.ja
Edycja: Zauważyłem, że do ciała dodano kolejne pytanie. Dodaję odpowiedź na to:
Jak mogę sprawdzić różnicę między różnicami rezydualnymi?
W tym celu należy stratyfikować zestaw danych i dopasować osobne modele, ponieważ sugerowany przeze mnie model oparty na interakcji ograniczy resztkową wariancję, aby była taka sama w każdej grupie. Jeśli pasujesz do osobnych modeli, to ograniczenie znika. W takim przypadku nadal można użyć testu współczynnika wiarygodności (prawdopodobieństwo dla większego modelu jest teraz obliczane poprzez zsumowanie prawdopodobieństwa z trzech oddzielnych modeli). Model „zerowy” zależy od tego, z czym chcesz go porównać
jeśli chcesz tylko przetestować wariancję, pozostawiając główne efekty, model „zerowy” powinien być modelem z interakcjami, które napisałem powyżej. Stopnie swobody dla testu wynoszą wówczas .2)
Jeśli chcesz przetestować wariancję łącznie ze współczynnikami, to model zerowy powinien być pierwszym modelem, który napisałem powyżej. Stopnie swobody dla testu wynoszą wówczas .6
źródło
gls(Sepal.Length ~ species:Petal.Width, data = iris)
species
gls(Sepal.Length ~ species*Petal.Width, data=iris)
gls
model, ale pozwalając na różne odchylenia resztkowe dla każdego gatunku z opcjąweights=varIdent(form=~1|Species)
(w odniesieniu do drugiego pytania)?Aby odpowiedzieć na te pytania za pomocą kodu R, wykonaj następujące czynności:
1. Jak mogę sprawdzić różnicę między zboczami?
Odpowiedź: Zbadaj wartość p ANOVA z interakcji Petal.Width według gatunków, a następnie porównaj stoki za pomocą lsmeans :: lstrends w następujący sposób.
2. Jak mogę sprawdzić różnicę między różnicami rezydualnymi?
Jeśli rozumiem pytanie, możesz porównać korelacje Pearsona z transformacją Fishera, zwaną także „r-to-z Fishera”, jak następuje.
3. Jaki jest prosty, skuteczny sposób prezentacji tych porównań?
„Zastosowaliśmy regresję liniową do porównania zależności długości oddzielenia od szerokości płatka dla każdego gatunku. Nie znaleźliśmy istotnej interakcji w zależnościach długości oddzielenia od szerokości płatka dla I. Setosa (B = 0,9), I. Versicolor (B = 1,4), ani I. Virginica (B = 0,6); F (2, 144) = 1,6, p = 0,19. Porównanie r-to-z Fishera wykazało, że korelacja Pearsona dla I. Setosa (r = 0,28) wynosiła istotnie niższa (p = 0,02) niż I. Versicolor (r = 0,55) Podobnie korelacja dla I. Virginica (r = 0,28) była znacznie słabsza (p = 0,02) niż obserwowana dla I. Versicolor. ”
Wreszcie, zawsze wizualizuj swoje wyniki!
źródło
Zgadzam się z poprzednią sugestią. Należy dopasować model regresji wielokrotnej ze zmienną fikcyjną dla każdego zestawu danych. Umożliwi to sprawdzenie, czy przechwyty różnią się. Jeśli chcesz również wiedzieć, czy stoki różnią się, musisz również uwzględnić interakcje między manekinami i zmienną, o której mowa. Nie ma problemu z tym, że dane są niezależne. Pamiętaj, że jeśli są one zarówno niezależne, jak i (na przykład) różne gatunki, nie byłbyś w stanie stwierdzić, czy zauważona różnica wynika z różnych gatunków, czy z różnych zestawów danych, ponieważ są one całkowicie pomieszane. Jednak nie ma testu / karta „wyjdź z więzienia”, która obejdzie ten problem bez zebrania nowej próbki i ponownego uruchomienia badania.
źródło