Jednym ze sposobów podsumowania porównania dwóch krzywych przeżycia jest obliczenie współczynnika ryzyka (HR). Istnieją (co najmniej) dwie metody obliczenia tej wartości.
- Metoda logrank. W ramach obliczeń Kaplana-Meiera oblicz liczbę zaobserwowanych zdarzeń (zwykle zgonów) w każdej grupie ( i O b ) oraz liczbę oczekiwanych zdarzeń przy założeniu zerowej hipotezy o braku różnicy w przeżyciu ( E a i E b ). Współczynnik ryzyka wynosi zatem:
H R = ( O a / E a )
- Metoda Mantela-Haenszela. Najpierw oblicz V, które jest sumą wariancji hipergeometrycznych w każdym punkcie czasowym. Następnie oblicz współczynnik ryzyka jako:
Mam oba te równania z rozdziału 3 Machin, Cheung i Parmar,Analiza przeżycia. Ta książka stwierdza, że te dwie metody zwykle dają bardzo podobne metody i tak właśnie jest w przypadku przykładu w książce.
Ktoś przysłał mi przykład, w którym dwie metody różnią się trzykrotnie. W tym konkretnym przykładzie oczywiste jest, że oszacowanie logranku jest rozsądne, a oszacowanie Mantela-Haenszela jest dalekie. Moje pytanie brzmi, czy ktoś ma jakieś ogólne porady dotyczące tego, kiedy najlepiej wybrać logrank oszacowania współczynnika ryzyka, a kiedy najlepiej wybrać szacunek Mantel-Haenszel? Czy ma to związek z rozmiarem próbki? Liczba remisów? Stosunek wielkości próbek?
Odpowiedzi:
Myślę, że wymyśliłem odpowiedź (na własne pytanie). Jeżeli założenie o proporcjonalnych zagrożeniach jest prawdziwe, obie metody dają podobne oszacowania współczynnika ryzyka. Rozbieżność, którą znalazłem w jednym konkretnym przykładzie, myślę teraz, wynika z faktu, że założenie to jest wątpliwe.
Jeśli założenie o proporcjonalnych zagrożeniach jest prawdziwe, wówczas wykres log (czas) vs log (-log (St)) (gdzie St jest proporcjonalnym przeżyciem w czasie t) powinien pokazywać dwie równoległe linie. Poniżej znajduje się wykres utworzony z zestawu danych problemów. Wydaje się dalekie od liniowego. Jeśli założenie o proporcjonalnych zagrożeniach jest nieważne, wówczas koncepcja współczynnika ryzyka jest bez znaczenia, a zatem nie ma znaczenia, która metoda zostanie zastosowana do obliczenia współczynnika ryzyka.
Zastanawiam się, czy rozbieżność między oszacowaniami logrank a Mantel-Haenszel współczynnika ryzyka może być wykorzystana jako metoda do testowania założenia proporcjonalnych zagrożeń?
źródło
Jeśli się nie mylę, estymator rang logu, o którym mówisz, jest również znany jako estymator szczupaka. Uważam, że jest ogólnie zalecane dla HR <3, ponieważ wykazuje mniejszą tendencję w tym zakresie. Interesujący może być następujący artykuł (zwróć uwagę, że w dokumencie określa się go jako O / E):
źródło
W rzeczywistości istnieje kilka innych metod, a wybór często zależy od tego, czy najbardziej interesuje Cię szukanie wczesnych różnic, późniejszych różnic lub - jak w przypadku testu log-rank i testu Mantela-Haenszela - przypisać jednakową wagę wszystkim punktom czasowym.
Na pytanie. Test log-rank jest w rzeczywistości formą testu Mantela-Haenszela zastosowanego do danych dotyczących przeżycia. Test Mantela-Haenszela jest zwykle używany do testowania niezależności w warstwowych tabelach kontyngencji.
Jeśli spróbujemy zastosować test MH do danych dotyczących przeżycia, możemy zacząć od założenia, że zdarzenia w każdym czasie awarii są niezależne. Następnie stratyfikujemy według czasu awarii. Używamy metod MH do tworzenia warstw każdego czasu awarii. Nic dziwnego, że często dają ten sam rezultat.
Wyjątek występuje, gdy jednocześnie występuje więcej niż jedno zdarzenie - wiele zgonów dokładnie w tym samym punkcie czasowym. Nie pamiętam, jak różni się leczenie. Myślę, że średnia logarytmiczna testu rangi dla możliwych kolejności powiązanych czasów awarii.
Więc test log-rank jest testem MH dla danych o przeżyciu i może poradzić sobie z więzami. Nigdy nie korzystałem z testu MH dla danych o przeżyciu.
źródło
Myślałem, że natknąłem się na stronę internetową i odnośniki, które dotyczą dokładnie tego pytania:
http://www.graphpad.com/faq/viewfaq.cfm?faq=1226 Zacznij od „Dwie porównywane metody”.
Witryna odwołuje się do ars Berste link link (powyżej):
http://www.jstor.org/stable/2530564?seq=1
Strona ładnie podsumowuje wyniki Bersteina i in., Dlatego zacytuję:
Witryna odwołuje się również do zestawu danych, w którym „dwa szacunki HR były bardzo różne (trzykrotnie)” i sugerują, że założenie PH jest kluczową kwestią.
Potem pomyślałem: „Kto jest autorem strony?” Po krótkich poszukiwaniach odkryłem, że to Harvey Motulsky. Więc Harveyowi udało mi się odesłać cię w odpowiedzi na twoje pytanie. Stałeś się autorytetem!
Czy „problematyczny zestaw danych” jest publicznie dostępnym zestawem danych?
źródło