Oto podsumowanie wyników modelu Coxpha, którego użyłem (użyłem R, a wynik jest oparty na najlepszym modelu końcowym, tj. Uwzględniono wszystkie istotne zmienne objaśniające i ich interakcje):
coxph(formula = Y ~ LT + Food + Temp2 + LT:Food + LT:Temp2 +
Food:Temp2 + LT:Food:Temp2) # Y<-Surv(Time,Status==1)
n = 555
coef exp(coef) se(coef) z Pr(>|z|)
LT 9.302e+02 Inf 2.822e+02 3.297 0.000979 ***
Food 3.397e+03 Inf 1.023e+03 3.321 0.000896 ***
Temp2 5.016e+03 Inf 1.522e+03 3.296 0.000979 ***
LT:Food -2.250e+02 1.950e-98 6.807e+01 -3.305 0.000949 ***
LT:Temp2 -3.327e+02 3.352e-145 1.013e+02 -3.284 0.001022 **
Food:Temp2 -1.212e+03 0.000e+00 3.666e+02 -3.307 0.000942 ***
LT:Food:Temp2 8.046e+01 8.815e+34 2.442e+01 3.295 0.000986 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Rsquare= 0.123 (max possible= 0.858 )
Likelihood ratio test= 72.91 on 7 df, p=3.811e-13
Wald test = 55.79 on 7 df, p=1.042e-09
Score (logrank) test = 78.57 on 7 df, p=2.687e-14
Pytaniem jest:
Jak interpretować wartości współczynników i exp (cef) w tym przypadku, ponieważ są to bardzo duże wartości? W grę wchodzi również interakcja 3 przypadków, co bardziej myli interpretację.
Wszystkie przykłady dotyczące modelu Coxpha, które do tej pory znalazłem w Internecie, były bardzo proste w odniesieniu do terminów interakcji (które zawsze okazały się nieistotne), a także wartości współczynników (= wskaźniki ryzyka) i ich wykładniczych (= współczynniki ryzyka) były dość małe i „łatwe w obsłudze” liczby, np. współczynnik = 1,73 -> exp (coef) = 5,64. ALE moje są znacznie większymi liczbami, jak widać z podsumowania (powyżej). A ponieważ są one tak duże, prawie nie wydają się mieć żadnego sensu.
Wydaje się nieco niedorzeczne myśleć, że przeżycie wynosi np. 8,815e + 34 (współczynnik ryzyka wzięty z interakcji LT: Jedzenie: Temp2) razy mniej, gdy interakcja wzrasta o jedną jednostkę (?).
Właściwie nie wiem też, jak interpretować tę interakcję z 3 przypadkami. Czy to oznacza, że gdy wszystkie zmienne wchodzące w interakcje wzrosną o jedną jednostkę, przeżycie zmniejsza się o pewną wartość (o czym świadczy wartość exp (coef))?
Byłoby wspaniale, gdyby ktoś mógł mi tutaj pomóc. :)
Poniżej znajduje się część mojego arkusza danych, którego użyłem do analizy Coxa. Tutaj możesz zobaczyć, że użyłem wielokrotnie tej samej wartości zmiennej objaśniającej (tj. LT, Żywności i Temp2) dla kilku „Czasów, zmiennych odpowiedzi stanu”. Te wartości zmiennych objaśniających są już średnimi wartościami tych zmiennych (ze względu na charakter pracy w terenie nie było możliwe uzyskanie indywidualnej wartości zmiennej objaśniającej dla każdej obserwowanej odpowiedzi, stąd średnie wartości zastosowane już w tej fazie ), a to odpowiadałoby sugestii 1 (?) (patrz pierwsza odpowiedź).
Sugestia 2 (patrz 1. odpowiedź): Używam R i nie jestem jeszcze super bogiem. :) Tak więc, jeśli użyję funkcji przewidywania (cox.model, type = "oczekiwano"), otrzymam ogromną liczbę różnych wartości i nie mam pojęcia, do której zmiennej objaśniającej się odnoszą iw jakiej kolejności. Czy jest możliwe wyróżnienie określonego terminu interakcji w funkcji przewidywania? Nie jestem pewien, czy wyrażam się tutaj jasno.
Sugestia 3 (patrz 1. odpowiedź): w części arkusza danych poniżej widać jednostki różnych zmiennych objaśniających. Wszystkie są różne i zawierają dziesiętne. Czy to może mieć coś wspólnego z wynikiem Coxa?
Część arkusza danych:
Time (days) Status LT(h) Food (portions per day) Temp2 (ºC)
28 0 14.42 4.46 3.049
22 0 14.42 4.46 3.049
9 1 14.42 4.46 3.049
24 0 15.33 4.45 2.595
24 0 15.33 4.45 2.595
19 1 15.33 4.45 2.595
Pozdrawiam, Unna
Odpowiedzi:
Kilka sugestii, niezwiązanych bezpośrednio z CoxPH, ale z interakcjami i kolinearnością
1) Kiedy dostajesz takie „szalone” wartości, jedną z możliwości jest kolinearność. Jest to często problem w przypadku interakcji. Czy wyśrodkowałeś wszystkie swoje zmienne (odejmując średnią z każdej)?
2) Nie da się tak łatwo zinterpretować jednej interakcji wśród wielu. LT, jedzenie i temp2 są zaangażowane w wiele interakcji. Spójrz więc na przewidywane wartości z różnych kombinacji.
3) Sprawdź jednostki różnych zmiennych. Kiedy dostajesz szalone parametry, czasem jest to problem z jednostkami (np. Mierzenie wysokości człowieka w milimetrach lub kilometrach)
4) Kiedy już to wszystko wyjaśnię, znajduję najprostszy sposób, aby pomyśleć o efektach różnych interakcji (szczególnie tych na wyższym poziomie), aby wykreślić przewidywane wartości z różnymi kombinacjami wartości niezależnych.
źródło