Chciałbym porównać dwa modele regresji liniowej, które reprezentują szybkości degradacji mRNA w czasie w dwóch różnych warunkach. Dane dla każdego modelu zbierane niezależnie.
Oto zestaw danych.
Rejestr czasu (godziny) (leczenie A) dziennik (leczenie B) 0 2,02 1,97 0 2,04 2,06 0 1,93 1,96 2 2,02 1,91 2 2,00 1,95 2 2,07 1,82 4 1,96 1,97 4 2,02 1,99 4 2,02 1,99 6 1,94 1,90 6 1,94 1,97 6 1,86 1,88 8 1,93 1,97 8 2,12 1,99 8 2,06 1,93 12 1,71 1,70 12 1,96 1,73 12 1,71 1,76 24 1,70 1,46 24 1,83 1,41 24 1,62 1,42
Oto moje modele:
Exp1.A.lm<-lm(Exp1$Time~Exp1$(Treatment A))
Exp1.B.lm<-lm(Exp1$Time~Exp1$(Treatment B))
Połączenie: lm (formuła = Exp1 $ Czas ~ Exp1 $ (Leczenie A)) Pozostałości: Min 1Q Mediana 3Q Max -6,8950 -1,2322 0,2862 1,2494 5,2494 Współczynniki: Oszacuj Std. Błąd wartość t Pr (> | t |) (Przechwyć) 74,68 6,27 11,91 2,94e-10 *** Exp1 $ (leczenie A) -36,14 3,38 -10,69 1,77e-09 *** --- Signif. kody: 0 „***” 0,001 ”**„ 0,01 ”*„ 0,05 ”.” 0,1 '' 1 Błąd resztkowy standardowy: 2,97 przy 19 stopniach swobody Wiele R-kwadrat: 0,8575, Skorygowany R-kwadrat: 0,85 Statystyka F: 114,3 dla 1 i 19 DF, wartość p: 1,772e-09 Połączenie: lm (formuła = Exp1 $ Czas ~ Exp1 $ (Leczenie B)) Pozostałości: Min 1Q Mediana 3Q Max -7,861 -3,278 -1,444 3,222 11,972 Współczynniki: Oszacuj Std. Błąd wartość t Pr (> | t |) (Przechwyć) 88,281 16,114 5,478 2,76e-05 *** Exp1 $ (leczenie B) -41,668 8,43 -4,994 8,05e-05 *** --- Signif. kody: 0 „***” 0,001 ”**„ 0,01 ”*„ 0,05 ”.” 0,1 '' 1 Błąd resztkowy standardowy: 5,173 przy 19 stopniach swobody Wiele R-kwadrat: 0,5676, Skorygowany R-kwadrat: 0,5449 Statystyka F: 24,94 dla 1 i 19 DF, wartość p: 8,052e-05
Aby porównać te dwa modele, użyłem następującego kodu.
anova(Exp1.A.lm,Exp1.B.lm)
Analiza tabeli odchyleń Model 1: Exp1 $ Czas ~ Exp1 $ Exp1 $ (leczenie A) Model 2: Exp1 $ Czas ~ Exp1 $ Exp1 $ (leczenie B) Res.Df RSS Df Sq Sq F Pr (> F) 1 19 167,60 2 19 508,48 0 -340,88
Moje pytanie brzmi: dlaczego analiza ANOVA nie pokazuje statystyki F i wartości p.val. Przepraszam, jeśli to naiwne pytanie.
Opierając się na różnych nachyleniach, szybkość degradacji jest różna w tych dwóch modelach, ale chciałbym wiedzieć, jak istotna statystycznie jest ta różnica. Mam nadzieję, że to ma sens.
Odpowiedzi:
Jeśli ustawisz dane w jednej długiej kolumnie z A i B jako nową kolumną, możesz uruchomić model regresji jako GLM z ciągłą zmienną czasową i nominalną zmienną „eksperymentalną” (A, B). Dane wyjściowe ANOVA podadzą znaczenie różnicy między parametrami. „przechwytywanie” jest wspólnym przechwytywaniem, a współczynnik „eksperymentu” będzie odzwierciedlał różnice między przechwytywaniami (właściwie ogólnymi średnimi) między eksperymentami. czynnik „Czas” będzie wspólnym nachyleniem, a interakcja jest różnicą między eksperymentami w odniesieniu na stok.
Muszę przyznać, że oszukuję (?) I uruchamiam modele oddzielnie, aby uzyskać dwa zestawy parametrów i ich błędy, a następnie uruchomić model połączony, aby uzyskać różnice między zabiegami (w twoim przypadku A i B) ...
źródło
Analiza ANOVA nie pokazuje statystyki F i wartości p., Ponieważ oba modele mają te same rezydualne stopnie swobody (tj. 19), a jeśli weźmiesz różnicę, wyniesie to zero! Po wykonaniu różnicy powinien być przynajmniej jeden stopień swobody, aby wykonać test F.
źródło