Czy zmienna X (hazard) w analizie proporcjonalnej regresji hazardu Coxa zawsze musi być czasem? Jeśli nie, czy mógłbyś podać przykład?
Czy wiek chorego na raka może być zmienną ryzyka? Jeśli tak, to czy można to interpretować jako ryzyko zachorowania na raka w pewnym wieku? Czy regresja Coxa byłaby uzasadnioną analizą do badania związku między ekspresją genów a wiekiem?
Zwykle wiek w punkcie początkowym jest używany jako zmienna towarzysząca (ponieważ często wiąże się z chorobą / śmiercią), ale może być również stosowany jako twoja skala czasu (myślę, że jest stosowany w niektórych badaniach podłużnych, ponieważ musisz mieć wystarczająco dużo osoby zagrożone w czasie, ale tak naprawdę nie pamiętam - właśnie znalazłem te slajdy na temat Analizowania badań kohortowych przy założeniu ciągłej skali czasowej, która mówi o badaniach kohortowych). W interpretacji należy zamienić czas zdarzenia na wiek i można uwzględnić wiek w momencie diagnozy jako zmienną towarzyszącą. Miałoby to sens, gdy badasz umieralność związaną z wiekiem na określoną chorobę (jak pokazano na tych slajdach ).
@chi: Wielkie dzięki. Zajrzę do gazet. Czy mógłbyś skomentować pierwsze pytanie? Czy zmienna ryzyka jest zawsze czasem?
fuk.
@yuk Niekoniecznie, jak sugeruje @whuber. Mam na myśli inne zastosowanie regresji Coxa dotyczące leczenia systematycznego wzorca brakujących odpowiedzi w testach edukacyjnych, ponieważ powstaje, gdy uczeń nie ma wystarczająco dużo czasu na ukończenie testu (brakujące odpowiedzi można wtedy uznać za prawidłowo ocenzurowane) - - w tym przypadku jest to zamawianie przedmiotów, które jest uważane za skalę czasu. Spojrzę na oryginalny artykuł (choć myślę, że był to także przedmiot doktoratu).
chl
+1. Istnieją inne dokumenty, ale nie jestem pewien, czy są one lepsze; Myślę, że Chalise wykonuje całkiem niezłą robotę, podsumowując sytuację.
ars
7
Nie, nie zawsze musi to być czas. Wiele ocenzurowanych odpowiedzi można modelować za pomocą technik analizy przeżycia. W swojej książce Nondetects and Data Analysis Dennis Helsel opowiada się za wykorzystaniem negatywu koncentracji w miejscu czasu (aby poradzić sobie z niewykrywalnościami, które po zanegowaniu stają się wartościami właściwie ocenzurowanymi). Streszczenie jest dostępne w sieci (format PDF) i pakietem R, NADA , wdraża to.
+1, dziękuję za wskazanie pakietu NADA. Zauważyłem, że ułatwia to obsługę danych ocenionych z lewej strony za pomocą pakietu przetrwania - czy cenzura z lewej jest powszechnym scenariuszem z danymi środowiskowymi?
ars
@whuber: Dziękuję za komentarz, pakiet NADA wygląda bardzo interesująco.
Fuj
@Andy: Dzięki za linki. Myślę, że warto być odpowiedzią. Głosowałbym za mną.
Fuj
@ Yuk, na twoją prośbę zamieściłem swój komentarz w odpowiedź, a @whuber dziękuję za twój przykład.
Andy W
@ars: Tak, lewy cenzurowanie jest charakterystyczny dla danych środowiskowych (i ogólnie stanowi kluczowy problem chemometrii). To trudny i interesujący problem. Wśród przyczyn są (1) same granice cenzury są określane przez szacunki statystyczne (w procesie kalibracji), (2) cenzura może występować na wiele sposobów - jako granice wykrywalności, granice kwantyfikacji lub „granice raportowania” 3) progi często różnią się w odpowiedzi na zmienne towarzyszące („interferencje macierzowe”), które mogą być silnie skorelowane z pierwotnymi wartościami ocenzurowanymi, (4) dane często są logarytmicznie rozłożone.
whuber
4
Jeśli chodzi o kwestię skali wieku w stosunku do czasu, chl ma kilka dobrych referencji i uchwyca najważniejsze - w szczególności wymóg, aby zestaw grup ryzyka zawierał wystarczającą liczbę osobników w każdym wieku, co pojawiłoby się w badaniu podłużnym.
Chciałbym jedynie zauważyć, że nie ma jeszcze ogólnej zgody w tej sprawie, ale istnieje literatura sugerująca, że wiek powinien być preferowany jako skala czasowa w niektórych przypadkach. W szczególności, jeśli masz sytuację, w której czas nie kumuluje się w ten sam sposób dla wszystkich osób, na przykład z powodu narażenia na działanie niektórych toksycznych materiałów, wiek może być bardziej odpowiedni.
Z drugiej strony możesz poradzić sobie z tym konkretnym przykładem na modelu PH Coxa w skali czasowej, wykorzystując wiek jako zmienną towarzyszącą o różnym czasie - zamiast stałej zmiennej w czasie początkowym. Musisz zastanowić się nad mechanizmem stojącym za przedmiotem badań, aby dowiedzieć się, która skala czasu jest bardziej odpowiednia. Czasami warto dopasować oba modele do istniejących danych, aby sprawdzić, czy pojawią się rozbieżności i jak można je wyjaśnić przed zaprojektowaniem nowego badania.
Wreszcie oczywista różnica w analizie tych dwóch polega na tym, że w skali wieku interpretacja przeżycia dotyczy skali bezwzględnej (wieku), podczas gdy w skali czasu jest ona związana z datą rozpoczęcia / rozpoczęcia badania .
Na prośbę PO, oto inna aplikacja, którą widziałem w analizie przeżycia stosowanej w kontekście przestrzennym (chociaż oczywiście różni się od pomiaru substancji środowiskowych wspomnianych przez whucera), modeluje odległość między zdarzeniami w przestrzeni. Oto jeden przykład z kryminologii, a tutaj jest jeden z epidemiologii .
Argumentacja za pomocą analizy przeżycia do pomiaru odległości między zdarzeniami nie jest, powiedzmy, kwestią cenzury (chociaż cenzura może definitywnie wystąpić w kontekście przestrzennym), a bardziej z powodu podobnych rozkładów między charakterystyką czasu na zdarzenie a odległością między zdarzeniami cechy (tj. oba mają podobne typy struktur błędów (często zanikanie odległości), które naruszają OLS, a zatem rozwiązania nieparametryczne są idealne dla obu).
Z powodu złych praktyk cytowania musiałem poświęcić godzinę na znalezienie odpowiedniego linku / referencji do linku powyżej.
Na przykład w kryminologii
Kikuchi, George, Mamoru Amemiya, Tomonori Saito, Takahito Shimada i Yutaka Harada. 2010. Analiza czasoprzestrzenna wiktymizacji bliskiej powtórki w Japonii . 8. krajowa konferencja nt. Mapowania przestępczości. Jill Dando Institute of Crime Science. Plik PDF jest obecnie dostępny na odnośnej stronie internetowej.
Nie, nie zawsze musi to być czas. Wiele ocenzurowanych odpowiedzi można modelować za pomocą technik analizy przeżycia. W swojej książce Nondetects and Data Analysis Dennis Helsel opowiada się za wykorzystaniem negatywu koncentracji w miejscu czasu (aby poradzić sobie z niewykrywalnościami, które po zanegowaniu stają się wartościami właściwie ocenzurowanymi). Streszczenie jest dostępne w sieci (format PDF) i pakietem R, NADA , wdraża to.
źródło
Jeśli chodzi o kwestię skali wieku w stosunku do czasu, chl ma kilka dobrych referencji i uchwyca najważniejsze - w szczególności wymóg, aby zestaw grup ryzyka zawierał wystarczającą liczbę osobników w każdym wieku, co pojawiłoby się w badaniu podłużnym.
Chciałbym jedynie zauważyć, że nie ma jeszcze ogólnej zgody w tej sprawie, ale istnieje literatura sugerująca, że wiek powinien być preferowany jako skala czasowa w niektórych przypadkach. W szczególności, jeśli masz sytuację, w której czas nie kumuluje się w ten sam sposób dla wszystkich osób, na przykład z powodu narażenia na działanie niektórych toksycznych materiałów, wiek może być bardziej odpowiedni.
Z drugiej strony możesz poradzić sobie z tym konkretnym przykładem na modelu PH Coxa w skali czasowej, wykorzystując wiek jako zmienną towarzyszącą o różnym czasie - zamiast stałej zmiennej w czasie początkowym. Musisz zastanowić się nad mechanizmem stojącym za przedmiotem badań, aby dowiedzieć się, która skala czasu jest bardziej odpowiednia. Czasami warto dopasować oba modele do istniejących danych, aby sprawdzić, czy pojawią się rozbieżności i jak można je wyjaśnić przed zaprojektowaniem nowego badania.
Wreszcie oczywista różnica w analizie tych dwóch polega na tym, że w skali wieku interpretacja przeżycia dotyczy skali bezwzględnej (wieku), podczas gdy w skali czasu jest ona związana z datą rozpoczęcia / rozpoczęcia badania .
źródło
Na prośbę PO, oto inna aplikacja, którą widziałem w analizie przeżycia stosowanej w kontekście przestrzennym (chociaż oczywiście różni się od pomiaru substancji środowiskowych wspomnianych przez whucera), modeluje odległość między zdarzeniami w przestrzeni. Oto jeden przykład z kryminologii, a tutaj jest jeden z epidemiologii .
Argumentacja za pomocą analizy przeżycia do pomiaru odległości między zdarzeniami nie jest, powiedzmy, kwestią cenzury (chociaż cenzura może definitywnie wystąpić w kontekście przestrzennym), a bardziej z powodu podobnych rozkładów między charakterystyką czasu na zdarzenie a odległością między zdarzeniami cechy (tj. oba mają podobne typy struktur błędów (często zanikanie odległości), które naruszają OLS, a zatem rozwiązania nieparametryczne są idealne dla obu).
Z powodu złych praktyk cytowania musiałem poświęcić godzinę na znalezienie odpowiedniego linku / referencji do linku powyżej.
Na przykład w kryminologii
Kikuchi, George, Mamoru Amemiya, Tomonori Saito, Takahito Shimada i Yutaka Harada. 2010. Analiza czasoprzestrzenna wiktymizacji bliskiej powtórki w Japonii . 8. krajowa konferencja nt. Mapowania przestępczości. Jill Dando Institute of Crime Science. Plik PDF jest obecnie dostępny na odnośnej stronie internetowej.
W epidemiologii
Czytelnik, Steven. 2000. Wykorzystanie analizy przeżycia do badania wzorców punktów przestrzennych w epidemiologii geograficznej. Nauki społeczne i medycyna 50 (7-8): 985–1000.
źródło