Czy dopasowanie modelu Coxa do interakcji między warstwami i zmiennymi kowariancyjnymi różni się od dopasowania dwóch modeli Coxa?

13

W Strategii modelowania regresji autorstwa Harrella (druga edycja) znajduje się sekcja (S. 20.1.7) omawiająca modele Coxa, w tym interakcję między zmienną towarzyszącą, której główny wpływ na przeżycie chcemy również oszacować (wiek w przykładzie poniżej) i zmienna towarzysząca, której głównego efektu nie chcemy oszacować (płeć w poniższym przykładzie).

Konkretnie: załóżmy, że w populacji (nieznane, prawdziwe) zagrożenie zgodne z modelemh(t)

h(t)={hf(t)exp(β1age),for female patienshm(t)exp((β1+β2)age),for male patiens
gdzie , są nieznane, prawda, nie do oszacowania wyjściowe funkcje hazardu i , są nieznane, prawdziwe parametry do oszacowania z danych.hfhmβ1β2

(Ten przykład pochodzi niemal dosłownie z książki).

Teraz Harrell zauważa, że ​​powyższą sytuację można przepisać jako model warstwowy modelu Coxa 1 :

h(t)=hgender(t)exp(β1age+β2X)
gdzie „termin interakcji” jest równy zero dla kobiet i wiek dla mężczyzn. Jest to wygodne, ponieważ oznacza, że ​​możemy użyć standardowej techniki do oszacowania i .Xβ1β2

Teraz pytanie. Załóżmy, że dwóch badaczy A i B otrzymuje tę samą próbę pacjentów z populacji opisanej powyżej. Badacz A pasuje do modelu 1, uzyskując oszacowania , dla prawdziwych parametrów wraz z przedziałami ufności.β^1β^2β1,β2

Badacz B przyjmuje bardziej naiwne podejście polegające na dopasowaniu dwóch zwykłych (tj. Niezadowolonych) modeli Coxa: model 2a: tylko u pacjentek w próbie i model 2b: na pacjentach płci męskiej w próbie. W ten sposób uzyskuje się szacunki , prawdziwych parametrów , wraz z przedziałami ufności.

h(t)=hf(t)exp(γ1age)
h(t)=hm(t)exp(γ2age)
γ1^γ2^β1,β1+β2

Pytanie:

  • Czy te szacunki są koniecznie takie same (w tym sensie, że , )? (Przypomnij, że obaj badacze patrzą na te same dane).β^1=γ^1β^2=γ^2γ^1
  • Czy przedziały ufności są koniecznie takie same?
  • Czy ma sens stwierdzenie, że badacz A ma psychologiczną przewagę nad badaczem B w przypadku, gdy , ponieważ wówczas badacz A jest bardziej prawdopodobne, że podejrzewa to i przechodzi do oszacowania bardziej oszczędnego modelu ?β2=0h(t)=hgender(t)exp(β1age)
Vincent
źródło

Odpowiedzi:

4

W przypadku modeli, w których każdy parametr musi być oszacowany (jak zwykłe najmniejsze kwadraty), możliwe jest stworzenie sytuacji, w której dwa oddzielne modele mają takie same oszacowania jednego z terminem interakcji. Na przykład moglibyśmy mieć: , podsumowane przez: , abyś mógł bezpośrednio oszacuj różnicę płci zarówno w punkcie przecięcia, jak i nachylenia. W rzeczywistości: . W takim przypadku zgadzam się z tobą, że unikalny model pozwoliłby mieć natychmiastowy pomysł na różnicę płci (podaną przez parametry interakcji,YM=αM+βMageYF=αF+βFageY=λ+λFF+γage+γFFageαM=λ,βM=γ,αFαM=λF,βFβM=γFλF, ponieważ różnica nachylenia ma jaśniejszą interpretację, a twoje pytanie odnosi się do tego). Jednak w przypadku modelu Coxa sprawy wyglądają inaczej. Po pierwsze, jeśli nie uwzględnimy płci w regresji, może istnieć przyczyna, tzn. Że nie spełnia ona założenia proporcjonalnego hazardu. Ponadto, jeśli zbudujemy unikalny model z płcią jako terminem interakcji, przyjmujemy wspólną podstawową funkcję hazardu (chyba że źle zrozumiałem znaczenie ), podczas gdy dwa osobne modele podejście pozwala na dwie oddzielne podstawowe funkcje hazardu, stąd implikowane są różne modele. hgender(t)

Patrz na przykład rozdział „Analiza przetrwania” Kleinbauma i Kleina, 2012, część serii Statystyka dla biologii i zdrowia.

Federico Tedeschi
źródło