Model proporcjonalnego hazardu Coxa i interpretacja współczynników, gdy występuje interakcja wyższych przypadków

9

Oto podsumowanie wyników modelu Coxpha, którego użyłem (użyłem R, a wynik jest oparty na najlepszym modelu końcowym, tj. Uwzględniono wszystkie istotne zmienne objaśniające i ich interakcje):

 coxph(formula = Y ~ LT + Food + Temp2 + LT:Food + LT:Temp2 + 
Food:Temp2 + LT:Food:Temp2) # Y<-Surv(Time,Status==1)

n = 555

               coef         exp(coef)          se(coef)      z           Pr(>|z|)     
LT             9.302e+02      Inf             2.822e+02    3.297        0.000979 *** 
Food           3.397e+03      Inf             1.023e+03    3.321        0.000896 *** 
Temp2          5.016e+03      Inf             1.522e+03    3.296        0.000979 *** 
LT:Food        -2.250e+02    1.950e-98        6.807e+01    -3.305       0.000949 *** 
LT:Temp2       -3.327e+02    3.352e-145       1.013e+02    -3.284       0.001022 ** 
Food:Temp2     -1.212e+03    0.000e+00        3.666e+02    -3.307       0.000942 *** 
LT:Food:Temp2   8.046e+01    8.815e+34        2.442e+01     3.295       0.000986 *** 
--- 
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

Rsquare= 0.123   (max possible= 0.858 ) 
Likelihood ratio test= 72.91  on 7 df,   p=3.811e-13 
Wald test            = 55.79  on 7 df,   p=1.042e-09 
Score (logrank) test = 78.57  on 7 df,   p=2.687e-14 

Pytaniem jest:

Jak interpretować wartości współczynników i exp (cef) w tym przypadku, ponieważ są to bardzo duże wartości? W grę wchodzi również interakcja 3 przypadków, co bardziej myli interpretację.

Wszystkie przykłady dotyczące modelu Coxpha, które do tej pory znalazłem w Internecie, były bardzo proste w odniesieniu do terminów interakcji (które zawsze okazały się nieistotne), a także wartości współczynników (= wskaźniki ryzyka) i ich wykładniczych (= współczynniki ryzyka) były dość małe i „łatwe w obsłudze” liczby, np. współczynnik = 1,73 -> exp (coef) = 5,64. ALE moje są znacznie większymi liczbami, jak widać z podsumowania (powyżej). A ponieważ są one tak duże, prawie nie wydają się mieć żadnego sensu.

Wydaje się nieco niedorzeczne myśleć, że przeżycie wynosi np. 8,815e + 34 (współczynnik ryzyka wzięty z interakcji LT: Jedzenie: Temp2) razy mniej, gdy interakcja wzrasta o jedną jednostkę (?).

Właściwie nie wiem też, jak interpretować tę interakcję z 3 przypadkami. Czy to oznacza, że ​​gdy wszystkie zmienne wchodzące w interakcje wzrosną o jedną jednostkę, przeżycie zmniejsza się o pewną wartość (o czym świadczy wartość exp (coef))?

Byłoby wspaniale, gdyby ktoś mógł mi tutaj pomóc. :)

Poniżej znajduje się część mojego arkusza danych, którego użyłem do analizy Coxa. Tutaj możesz zobaczyć, że użyłem wielokrotnie tej samej wartości zmiennej objaśniającej (tj. LT, Żywności i Temp2) dla kilku „Czasów, zmiennych odpowiedzi stanu”. Te wartości zmiennych objaśniających są już średnimi wartościami tych zmiennych (ze względu na charakter pracy w terenie nie było możliwe uzyskanie indywidualnej wartości zmiennej objaśniającej dla każdej obserwowanej odpowiedzi, stąd średnie wartości zastosowane już w tej fazie ), a to odpowiadałoby sugestii 1 (?) (patrz pierwsza odpowiedź).

Sugestia 2 (patrz 1. odpowiedź): Używam R i nie jestem jeszcze super bogiem. :) Tak więc, jeśli użyję funkcji przewidywania (cox.model, type = "oczekiwano"), otrzymam ogromną liczbę różnych wartości i nie mam pojęcia, do której zmiennej objaśniającej się odnoszą iw jakiej kolejności. Czy jest możliwe wyróżnienie określonego terminu interakcji w funkcji przewidywania? Nie jestem pewien, czy wyrażam się tutaj jasno.

Sugestia 3 (patrz 1. odpowiedź): w części arkusza danych poniżej widać jednostki różnych zmiennych objaśniających. Wszystkie są różne i zawierają dziesiętne. Czy to może mieć coś wspólnego z wynikiem Coxa?

Część arkusza danych:

Time (days)     Status      LT(h) Food (portions per day) Temp2 C)
28                0         14.42        4.46             3.049
22                0         14.42        4.46             3.049
9                 1         14.42        4.46             3.049
24                0         15.33        4.45             2.595
24                0         15.33        4.45             2.595
19                1         15.33        4.45             2.595

Pozdrawiam, Unna

Unna
źródło
@MansT: Miło, że zredagowałeś pytanie ;-)
ocram,

Odpowiedzi:

7

Kilka sugestii, niezwiązanych bezpośrednio z CoxPH, ale z interakcjami i kolinearnością

1) Kiedy dostajesz takie „szalone” wartości, jedną z możliwości jest kolinearność. Jest to często problem w przypadku interakcji. Czy wyśrodkowałeś wszystkie swoje zmienne (odejmując średnią z każdej)?

2) Nie da się tak łatwo zinterpretować jednej interakcji wśród wielu. LT, jedzenie i temp2 są zaangażowane w wiele interakcji. Spójrz więc na przewidywane wartości z różnych kombinacji.

3) Sprawdź jednostki różnych zmiennych. Kiedy dostajesz szalone parametry, czasem jest to problem z jednostkami (np. Mierzenie wysokości człowieka w milimetrach lub kilometrach)

4) Kiedy już to wszystko wyjaśnię, znajduję najprostszy sposób, aby pomyśleć o efektach różnych interakcji (szczególnie tych na wyższym poziomie), aby wykreślić przewidywane wartości z różnymi kombinacjami wartości niezależnych.

Peter Flom
źródło
Cześć, poniżej znajduje się część mojego arkusza danych, którego użyłem do analizy Coxa. Tutaj możesz zobaczyć, że użyłem wielokrotnie tej samej wartości zmiennej objaśniającej (tj. LT, Żywności i Temp2) dla kilku zmiennych czasu, statusu odpowiedzi. Te wartości zmiennych objaśniających są już średnimi wartościami tych zmiennych (ze względu na charakter pracy w terenie nie było możliwe uzyskanie indywidualnej wartości zmiennej objaśniającej dla każdej obserwowanej odpowiedzi osobnika, stąd średnie wartości zastosowane już w tej fazie ), a to odpowiadałoby sugestii 1 (?).
Unna,
Sugestia 2: Używam R i nie jestem jeszcze super bogiem. :) Tak więc, jeśli użyję funkcji przewidywania (cox.model, type = "oczekiwano"), otrzymam ogromną liczbę różnych wartości i nie mam pojęcia, do której zmiennej objaśniającej się odnoszą iw jakiej kolejności. Czy jest możliwe wyróżnienie określonego terminu interakcji w funkcji przewidywania? Nie jestem pewien, czy wyrażam się tutaj jasno.
Unna,
Sugestia 3: w części arkusza danych poniżej widać jednostki różnych zmiennych objaśniających. Wszystkie są różne i zawierają dziesiętne. Czy to może mieć coś wspólnego z wynikiem Coxa?
Unna,
Czas (dni) Status LT (h) Jedzenie (porcje dziennie) Temp2 (ºC) 28 0 14,42 4,46 3,049 22 0 14,42 4,46 3,049 9 1 14,42 4,46 3,049 24 0 15,33 4,45 2,595 24 0 15,33 4,45 2,595 19 1 15,33 4,45 2,595
Unna
Powyższy komentarz do przykładu arkusza danych, którego użyłem, nie pokazuje się w kształcie tabeli, ale mam nadzieję, że da się z niego zrozumieć. :)
Unna,