Chciałbym uzyskać porady dotyczące łączenia wykresów kalibracyjnych / statystyk po wielokrotnym imputacji. W kontekście opracowywania modeli statystycznych w celu przewidywania przyszłego zdarzenia (np. Wykorzystanie danych z rejestrów szpitalnych do przewidywania przeżycia lub zdarzeń po wypisie ze szpitala), można sobie wyobrazić, że brakuje wielu informacji. Wielokrotna imputacja jest sposobem na poradzenie sobie z taką sytuacją, ale powoduje potrzebę połączenia statystyk testów z każdego zestawu danych imputacji, biorąc pod uwagę dodatkową zmienność wynikającą z nieodłącznej niepewności imputacji.
Rozumiem, że istnieje wiele statystyk kalibracji (hosmer-lemeshow, Emax Harrella, szacowany wskaźnik kalibracji itp.), Do których mogą mieć zastosowanie „regularne” reguły Rubina dotyczące łączenia.
Jednak statystyki te często są ogólnymi miarami kalibracji, które nie pokazują konkretnych źle skalibrowanych obszarów modelu. Z tego powodu wolałbym spojrzeć na wykres kalibracji. Niestety nie mam pojęcia, jak „połączyć” wykresy lub leżące za nimi dane (przewidywane prawdopodobieństwa na osobę i obserwowany wynik na osobę) i nie mogę znaleźć wiele w literaturze biomedycznej (dziedziny, którą znam), lub tutaj, na CrossValidated. Oczywiście spojrzenie na wykres kalibracji każdego zestawu danych imputacyjnych może być odpowiedzią, ale może stać się dość uciążliwe (prezentować), gdy powstaje wiele zestawów imputacyjnych.
Chciałbym zatem zapytać, czy istnieją techniki, które skutkowałyby wykresem kalibracyjnym, połączonym po wielokrotnym imputacji (?)
Odpowiedzi:
Odnośnie referencji:
źródło